An Investigation of Generative AI in Educational Application: Focusing on the Usage of ChatGPT for Learning Biology

Research Article
변 정호  Jung-Ho Byeon1권 용주  Yong-Ju Kwon2*

Abstract

Recently, generative AI could create new information and contents similar to the real, and the AI interacts like humans. The investigation of teaching and learning is essential to use generative AI in education. Therefore researchers performed a literature review of the characteristics and types of generative AI for the guide and direction of the educational application. ChatGPT is a representative example of generative AI, and it is an unsupervised learning model based on GPT(a deep learning-based language model). It can generate output like humans from pre-learned big data and experience similar to the teacher and student interaction. In particular, life science targets living organisms and must consider multidimensional perspectives. Therefore generative AI can use as an assistance tool for concept learning and inquiry activities in biology education. According to the theoretical considerations and use cases presented above, it was possible to learn with the help of generative AI without experts to verify learners' intuition concepts, inquiry performance, maintain safety, analysis of results, and etc. Researchers present a teaching-learning model using generative AI based on a literature review and examples for biological concept learning and inquiry activities using ChatGPT. It is necessary to shift the evaluation method from quantitative to qualitative to utilize generative AI. Also, it is essential to present a strategy for teaching and learning using AI in consideration of ethical aspects and to develop learners' decision-making capabilities.

Keyword



Introduction

팬데믹으로 인한 과학 · 기술과 정보통신에 대한 인식의 긍정적 변화는 사회 시스템의 디지털화를 급속히 앞당겼으며, 디지털 기술의 질적 · 양적 증가는 제한적 영역에 적용되던 인공지능이 사회, 경제, 교육 등 모든 영역에 활용되는 새로운 패러다임으로의 전환을 유발하였다(Vincent-Lancrin, 2021). 1956년 인공지능(AI: Artificial Intelligence)이라는 개념의 등장 이후 최근 몇 년 동안 빅 데이터, 클라우드 컴퓨팅, 머신러닝 등 관련 기술의 혁신을 통해 인공지능이 비약적으로 발전함으로써 인공지능의 활용성과 확장성은 이전과 비교할 수 없을 정도로 증가하였다(Su & Yang, 2022). 특히 인공지능 시스템 활용에 필수적 기술인 데이터의 수집과 처리 속도가 빨라지고 신뢰성이 높아지면서, 자연어 처리, 자율주행 및 로봇공학, 컴퓨터 시각인식, 언어학습 같은 분야에서 기술적 진보를 이루었다(OECD, 2019). 첨단기술에 의한 사회 시스템 변화에 따라 세계 각국은 교육을 통해 양성하는 미래 인재의 역랑과 미래 산업사회에서 요구하는 인재상의 불일치가 발생하지 않도록 인공지능 기반 교육의 패러다임 전환을 적극적으로 추구하고 있다(Molenaar, 2021; UNESCO, 2022). 특히, 미래 교육 분야에서 인공지능 중심의 디지털 환경 조성과 역량 개발을 위한 다양한 노력을 기울이고 있으며, 우리나라도 정부주도로 ‘인공지능 수학’, ‘인공지능 기초’ 같은 고등학교 교육과정 개발 및 디지털 교육체제로의 전환을 위해 AI와 에듀테크를 활용한 교육혁신을 목표로 다양한 정책을 제시하고 있다(MOE, 2022).

교육에 인공지능을 활용할 경우 전통적 방법으로는 해결하기 어려운 개인 맞춤형 진단, 학습, 피드백 같은 현실적 문제들을 해결할 수 있다는 인식과 함께 관련 분야에 대한 꾸준한 연구개발이 이루어져왔다(Holmes, Bialik, & Fadel, 2019; Hwang et al., 2020). 그러나 학습과정에 내포된 수많은 매개변수의 범주화, 데이터 처리를 위한 라벨링 문제 등으로 주로 규칙기반의 전통적 인공지능 기술이 적용되어 왔으며, 제한적 상황에서의 학습, 메타 데이터 부족으로 인한 실용성 부족 등으로 인해 특정 학습 영역을 제외하면 두드러진 성과를 체감하기 어려운 실정이었다(Shamir &Levin, 2022). 반면, 최근 인공지능 관련 기술의 다양화, 방대한 데이터를 처리할 수 있는 하드웨어의 개발, 새로운 방식의 인공지능 모델링 등장 등 다양한 요인들은 인공지능을 활용한 교육패러다임 전환의 새로운 기회를 제공하고 있다(Guan et al., 2020).

2014년 이후 새롭게 등장하고 있는 다양한 인공지능 신경망 모델들은 기존의 정보 판별 · 인출 수준을 넘어 새로운 콘텐츠의 생성을 가능하게 한다. 최근 전 세계적으로 관심을 받고 있는 대표적인 생성적 인공지능인 ChatGPT, Dall˙E2 등은 생성적 적대 신경망(GANs: Generative adversarial networks)을 기반으로 하고 있다. GANs는 입력 정보와 유사성을 지니지만 동일하지 않은 그럴듯한 콘텐츠를 만들어내는 생성모델과 생성된 콘텐츠가 실제 정보인지 생성된 유사 정보인지 판별하는 판별모델로 구성된다. 두 가지 모델은 훈련하는 동안 서로를 능가하기 위해 경쟁함으로써 평형상태에 도달하고, 판별모델에 의해 실제 정보와 구분할 수 없는 콘텐츠를 생성할 수 있다(Bommarito & Katz, 2022; Goodfellow et al., 2020). 생성적 인공지능의 데이터 생성 메커니즘은 실제 데이터와 유사한 새로운 정보를 생성하여 제시함으로서 입력된 내용이나 검색결과를 단순히 제시하는 기존 챗봇과 달리 인간과 유사한 언어적 표현을 생성하여 제공하기 때문에 자연스러운 상호작용을 가능하게 한다. 다만, 학습한 데이터, 모델에 적용된 매개변수의 종류, 개발자의 편견, 인공지능 기반 첨단조작 기술(deepfake) 등 다양한 요인 때문에 인공지능에 의해 생성된 정보를 무분별하게 활용할 경우 학습자에게 미치는 부정적인 영향에 대한 우려도 조심스럽게 제기되고 있다(Chatterjee & Dethlefs, 2023).

따라서, 새로운 유형의 인공지능 활용이 가능한 시점에 교육 현장에서 생성적 인공지능의 활용을 위해서는 기술적 측면과 교수 · 학습적 측면의 검토가 필수적이며, 향후 학습분야에 어떻게 활용할 수 있는지에 대해 관련 문헌 고찰과 활용 가능성에 대한 실증적 검토가 반드시 선행되어야 한다. 이런 맥락에서 이 연구에서는 생성적 인공지능의 특징과 유형에 대한 문헌들을 고찰하고, 생물교육 영역에서 교육적 활용 방안과 관련한 사용 사례를 중심으로 생성적 인공지능 활용 교육의 방향성을 제시하고자 한다.

AI for Education

AI in Education

4차 산업혁명시대 초 · 중등 교육의 패러다임 전환을 위한 프레임워크로 제안된 교육 4.0은 디지털화, 네트워킹, 인공지능을 핵심으로 하며, 개인 맞춤형 교육, 기초 학습의 자동화, 협업중심의 학습, 보편적 학습을 통한 교육격차 해소, 미래 산업사회에 적합한 인재양성을 위한 인공지능의 교육적 활용을 강조하고 있다(Bonfield et al., 2020; Haderer & Ciolacu, 2022). 특히 창의적 역량과 기술 역량 개발을 위한 학습 콘텐츠 개발, 학습자 주도 개별화 학습, 협업중심 학습 경험을 제공하기 위해 인공지능의 적극적 활용을 제안하고 있다(WEF, 2020). 그렇지만, 인공지능 등장 이후 교육 분야 활용의 변화를 체감할 수 있는 것은 최근 10년이며, 이전에는 주로 인공지능의 활용을 위해 전문적 수준의 프로그래밍 소양을 갖추어야만 가능한 것으로 인식하는 경향이 있었다. 그러나 머신러닝과 빅데이터 기술의 발달, 사회의 디지털화 등 누구나 인공지능에 접근하여 활용할 수 있도록 접근성이 개선됨으로써 교육현장에서도 교사와 학생의 인공지능 활용이 가능해지고 있다(Molenaar, 2021).

인공지능 활용 초기에는 컴퓨터 교육에 초점을 맞춘 인공지능 개발과 소양을 위한 교육에 초점을 맞추었으나, 최근에는 학습자 반응에 대해 적합한 피드백을 제공하거나 과제 수행을 학습자에 맞춰 조절하는 등 온라인 평가 시스템 같은 플랫폼 형태의 활용으로 점차 활용범위가 넓어지고 있다(Henlein & Kaplan, 2019; Ouyang & Jiao, 2020). 또한 인공지능은 전통적 교육방법으로는 개발할 수 없었던 교수 설계 및 연구의 새로운 대안을 제공하는 강력한 도구로 인식됨으로써, 인공지능 모델과 플랫폼을 교수학습에 활용하는 ʻ교육을 위한 인공지능 활용’이 대중화되고 있다(Holmes et al., 2019; Hwang et al., 2020). 인공지능을 교육 현장에서 쉽게 활용할 수 있는 환경이 조성됨에 따라 학습을 더 흥미롭게 할 수 있으며, 개별 학생에 맞춘 학습자 주도형 학습을 실현할 수 있는 가능성은 더욱 증가하고 있다(Molenaar, 2021). 반면, 인공지능을 교육현장에 적용하기 위해서는 다양한 학습 요소를 고려하고, 인공지능 활용을 통해 달성하고자 하는 목적을 명확히 함으로서 수업 중 발생할 수 있는 교수 · 학습적 문제와 인공지능 윤리 등에 대한 분석 및 대응을 위한 준비가 필요하다(Menon & Janardhan, 2021).

교육은 인공지능 활용 가능성이 급격히 증가하는 분야이므로 교실수업 상황의 맥락에서 미래세대를 위한 교육혁신을 실현하기 위해 세계 각국과 다수의 에듀테크 기업들은 인공지능을 활용한 맞춤형 개별화 학습 시스템, 교실 환경관리 시스템, 진단 및 평가 시스템 등을 개발하여 보급하고 있다(Guan et al., 2020). 인공지능의 활용성과 필요성이 빠르게 확대되고 있는 상황에서 교육현장의 성공적 적용과 활용을 위해서는 거시적·미시적 수준의 검토가 필수적이다. 국가나 기업이 거시적 관점에서 인공지능 활용 시스템의 개발과 정책에 초점을 맞추고 있다면, 교실 수업 수준에서는 교사와 학생이 어떤 인공지능을 어떻게 활용하는 지에 초점을 맞추어야 하므로 인공지능 기술에 대한 고찰을 통한 인공지능 활용의 방향성 탐색이 필요하다.

Types of AI Techniques

UNESCO (2022)에서는 학교에 적용 가능한 인공지능 기술(AI technique)을 전통적 인공지능(classical AI), 머신러닝(Machine learning), 지도학습(supervised learning), 비지도학습(Unsupervised learning), 강화학습(Reinforcement learning), 신경망(Neural networks), 딥러닝(Deep learning), 생성적 적대 신경망(Generative adversarial networks)으로 구분하고 있다.

전통적 인공지능은 규칙기반(Rule-based) 알고리즘을 의미하며 ‘만약,~라면(if-then)’의 논리 구조에 의해 결과를 생성한다. 규칙기반 추론은 ʻ요금’, ʻ변경’이라는 단어를 입력하면 여러 가지 요금제를 제시하는 것 같은 챗봇 기술에 주로 사용된다(Ouyang & Jiao, 2020; Yang et al., 2021). 알고리즘 변경이나 매개변수 추가 없이는 새로운 정보에 대한 처리가 어려운 규칙기반 인공지능과 달리, 머신러닝은 최적화 함수모델을 통해 학습함으로써 유사한 정보를 처리할 수 있다. 머신러닝은 대량의 데이터를 수집 및 처리함으로써 개발자가 명시적으로 프로그래밍 하지 않은 문제를 학습할 수 있는 알고리즘을 의미하며, 최적화 함수 생성 유형에 따라 일반적으로 지도학습, 비지도학습, 강화학습으로 구분할 수 있다(Menon & Janardhan, 2021). 지도학습은 머신러닝의 한 유형으로 입출력에 대한 정보와 상태가 제시된 모델을 통해 정보를 처리하며, 결과물 생산을 위해 데이터 라벨링을 수행하므로 범주화 및 의사결정 트리 같은 분류 알고리즘에 주로 활용된다. 최근 교육적 활용도가 증가하고 있는 Teachable machine 같은 인공지능 플랫폼을 활용하는 교수학습 프로그램 및 연구들 대부분은 지도학습과 관련되어 있다(Chang et al., 2021).

비지도학습은 입력과 출력에 대한 정보가 미리 주어지지 않으므로, 알려지지 않고 라벨링되지 않은 입력 데이터들 사이에서 발견되는 군집 유사성에 따라 새로운 데이터를 생성하는 차원축소 및 지식추출 등에 사용된다. 강화학습은 제시된 상태에 대한 최적 행동을 선택하는 학습 모델을 의미하므로, 행동의 좋고 나쁨을 알려주는 보상 또는 강화를 제공한다. 자율 주행자동차를 위한 인공지능이 언제 브레이크가 작동해야 하는지에 대한 최적 시점을 학습하는 것처럼 강화학습은 가장 적합한 행동을 수행하는 것이 필수적인 게임이나 로봇제어 등에 주로 사용된다(Shamir & Levin, 2022; Yang et al., 2021).

인공신경망은 사람이나 동물의 뇌를 모방한 알고리즘으로 신경세포가 연결된 것처럼 입력층, 다수의 은닉층, 출력층으로 구성된 인공신경망이 존재한다. 특히, 은닉층에서 데이터는 개별값과 가중치에 기반한 노드를 거치면서 처리된다. 필터링된 데이터는 하나 이상의 은닉층을 통과하면서 출력층으로 이동하며, 개별 노드에 대한 입력의 정확성과 효과를 이용하여 은닉층의 가중치를 조정함으로써 오류를 최소화하는 역전파를 통해 학습이 이루어진다. 다수의 심층 신경망은 입력 데이터를 계열적으로 처리함과 동시에 피드백을 통해 적절한지에 대한 선별이 이루어지므로 바둑, 자연어 처리, 음성인식 등에 주로 활용된다(Sairete et al., 2021; Ouyang & Jiao, 2020). 딥러닝은 다수의 은닉층을 지닌 인공신경망을 의미하며, 데이터 라벨 부여는 이후에 수행됨으로써 사전에 개발자에 의해 구조화된 데이터에 의존하는 머신러닝과 달리 비구조화된 이미지나 텍스트 데이터를 처리할 수 있으므로 이미지와 음성 인식 등에 사용된다(Guan et al., 2020; Su & Yang, 2022).

생성적 적대 신경망은 새로운 콘텐츠를 생성하도록 설계된 머신러닝의 한 유형으로써 상반되는 두 가지 심층 신경망 모델을 지닌다. 하나는 입력 정보를 바탕으로 새로운 콘텐츠를 생성하고 나머지 하나는 생성한 콘텐츠의 진위를 평가한다. 인간에 의해 정제된 데이터를 학습하는 지도학습과 달리 알고리즘이 스스로 답을 찾는 비지도학습에 해당하며, 생성과 평가라는 상반된 두 가지 모델은 서로 경쟁함으로서 점진적으로 정교해진 결과물을 생성한다(Goodfellow et al., 2020; Yang et al., 2021; Wu et al., 2022). 더 나아가, 최근의 생성적 적대 신경망과 같은 새로운 모델링 기법을 통해 등장한 인공지능들은 인간이 만들어낸 것인지 인공지능이 만들어낸 것인지 구분하기 어려운 수준의 새로운 정보를 생성하기 때문에 생성적 인공지능(Generative AI)으로 불리며 인공지능 기술의 혁신으로 인식되고 있다.

New Paradigm of AI & Education

What is the Generative AI?

교육적으로 주로 활용되고 있는 인공지능은 결과물을 생성하도록 훈련하기 위해 초기 데이터 제공 및 학습이 필요하고 라벨링 된 데이터를 처리하는 알고리즘을 사용하는 것이 일반적이며, 학습과정에서 입력한 데이터를 전사하여 그대로 제시하거나 차원 축소된 유사성 범주에 부합하는 결과를 선별적으로 제시한다. 반면, 생성적 인공지능(Generative AI)은 사전에 학습한 데이터와 유사성을 지니지만 새로운 이미지, 텍스트, 사운드 등의 결과물을 만들 수 있는 인공지능을 의미한다. 이러한 생성적 인공지능은 입력 프롬프트에 내포된 데이터 샘플 절편들로부터 맥락적 분석이 가능하며, 알고리즘이 생성해낸 결과물과 사용자가 입력한 내용과의 상호비교가 가능한 인공지능이다(Goodfellow et al., 2020).

더 나아가, 생성적 인공지능은 빠르고 효율적일 뿐만 아니라, 많은 경우 인간이 만드는 것보다 더 신속하고 체계적이고 정확한 결과물을 제공하기도 한다. 생성적 인공지능은 소셜 미디어의 텍스트 작성, 게임 개발, 광고 문구 작성, 코딩, 그래픽 디자인, 제품 디자인, 마케팅, 법률, 의료 등 인간이 수행하는 대부분의 영역에서 효율적이고 적절한 해결책 제공이 가능하다(Goodfellow et al., 2020; Lim et al., 2023; Okaibedi, 2023). 생성적 인공지능은 아직 초기단계에 불과하지만, 최근 6개월 동안 그 어떤 분야보다는 관심도가 급증하고 있다(Fig. 1). 텍스트 기반으로 자연어를 처리하여 인간의 대화와 유사한 상호작용이 가능한 OpenAI의 ChatGPT와 텍스트로 원하는 이미지의 속성들을 제시하면 개념의 관계를 파악하여 이미지를 생성해주는 Dall.E2, 특정 문장을 입력하면 원하는 비디오 클립을 만들어주는 Meta의 ‘Make A Video’, 서비스 예정인 구글의 Imagen Video는 생성적 인공지능의 대표적인 사례들이다(Singer et al., 2022).

http://dam.zipot.com:8080/sites/BDL/images/N0230130101_image/Fig_BDL_13_01_01_F1.png

Fig. 1. Changes of interest in ‘Generative AI’ over the past year in Google Trends (Google, 2023)

생성적 인공지능을 구현하기 위한 모델은 생성적 적대 신경망(GANs: Generative Adversarial Networks), 변형 오토인코더(VAEs: Variational Autoencoders), 픽셀 순환신경망(PixelRNN: Pixel Recurrent Neural Networks) 모델 등이 제시되고 있으나, 최근 다양한 분야에 대한 활성 가능성과 성과를 보이는 대표적인 모델은 GANs이다(Goodfellow et al., 2014; Goodfellow et al., 2020; Kingma & Welling, 2013; Oord et al., 2016). GANs는 컴퓨터 비전, 자연어 처리, 음성 합성, 시계열 합성 등 다양한 영역에 널리 이용되고 있으나, 최근 딥러닝 분야에서 가장 많은 관심을 받고 있다. 다른 모델들과 비교할 때, 편견을 제거하고 원하는 정보를 효과적으로 생성할 수 있는 장점으로 인해 실제 이미지와 구분하기 어려운 유사 이미지 생성, 이미지 변환 및 완성, 초해상도 등을 구현할 수 있다(Goodfellow et al., 2020). 반면, 일반화, 훈련 난이도, 모델 평가의 어려움과 같은 문제로 진입장벽이 높은 편이나, 특히 컴퓨터 비전, 이미지 생성, 번역 및 교정에서의 활용성이 입증되고 있다. GANs에 다른 신경망 모델을 함께 적용하면 네트워크를 통해 비구조화된 데이터를 학습함으로써 사실적 이미지 생성, 음성 및 텍스트 교정, 음악 구성, 텍스트 생성 등의 실제와 유사한 새로운 콘텐츠 생성이 가능하다(Wu, Stouffs, & Biljecki, 2022).

Generative AI based on GPT

생성적 인공지능의 대표적인 모델은 최근 큰 이슈가 되고 있는 ChatGPT이다. ChatGPT는 1750억개의 매개변수로 생산된 거대한 신경망을 지닌 딥러닝 기반 언어모델인 GPT-3 (Generative Pre-trained Transformer-3)를 기반으로 한다. GPT-3모델은 언어 번역, 질문과 답변, 밈 생성과 같은 분야에서 사용이 증가하고 있으며, 비지도학습에 해당하기 때문에 인터넷에서 학습한 방대한 양의 빅데이터를 기반으로 콘텐츠를 생성한다. GPT-3는 머신러닝으로 구현할 수 있는 것을 동일하게 수행할 뿐만 아니라, 인간과 유사한 방식으로 상호작용하며 대화할 수 있다(Chatterjee & Dethlefs, 2023). 특히 ChatGPT는 강화학습 요소를 추가하여 모델의 학습결과에 영향을 줌으로써 편향을 스스로 조정할 수 있도록 사용자의 피드백을 통해 학습하고 생성된 결과물을 검증하는 대화형 인공지능모델이다(Chatterjee & Dethlefs, 2023). 2022년 11월 일반에 공개된 후 급속도로 사용자가 증가하고 있으며, 다양한 분야에 대한 활용 사례들이 제시됨으로써 인공지능의 새로운 패러다임을 이끌고 있다. 일부 연구들에서는 ChatGPT가 미국 전문 법률인증 시험 통과, 미국 의료면허 시험 통과, 양적 거래에 대한 가이드 생성, 생물정보학에 대한 개념 생성, 코딩 생성 등 다양한 사례를 제시하고 있다(Bommarito & Katz, 2022; Kung et al., 2023).

ChatGPT는 OpenAI가 훈련한 대규모 언어 모델로 사용자의 입력 프롬프트에 답하고 정보를 제공하는 등 광범위한 작업을 지원하기 위해 자연어를 이해하고 생성할 수 있도록 설계된 머신러닝 시스템이다(Okaibedi, 2023). 인간과 유사한 방식으로 사용자와 상호작용하고 피드백을 통해 학습하도록 설계되었으며, 사용자가 입력하는 프롬프트에 대한 답을 제공하거나 관련된 정보를 제공할 수 있다. 이때 제공하는 답변이나 정보는 2021년까지 학습한 웹에 존재하는 비구조화된 데이터를 활용한 것으로 동일하지 아니지만 유사성을 지니고 있는 생성된 결과물이다(Kung et al., 2023). 현재 적용된 GPT-3.5모델은 자동적으로 출처를 제공하지 않으며, 실시간 웹 데이터 검색이 어려운 점 등의 제한점을 지니지만 웹 데이터 실시간 검색을 통해 단시간 내에 적절한 형태의 내용을 생성할 수 있는 인공지능이 배포될 가능성이 있다(Adams & Chuah, 2022).

ChatGPT와 같은 인공지능 챗봇은 인간과 유사한 방식으로 사용자의 입력 데이터를 이해하고 응답하도록 프로그래밍 된 인공지능으로 자연어 처리를 통해 사용자와 대화를 나눌 수 있도록 설계되었다. 일반적으로 사용자의 입력 프롬프트에 답변하거나, 사용자가 제시한 문제를 해결하기 위한 서비스 제공 등에 주로 활용되며, 일정이나 작업을 관리하는 개인 맞춤형 서비스, 게임 등에 다양하게 활용되고 있다. 교육적 측면에서 챗봇의 활용은 영어 학습에서 두드러지게 나타나고 있으며, 과학교육 분야에서는 관련 연구나 사례가 미비한 편이다(Jang et al., 2021). 인공지능이 대화를 통해 인간과 상호작용 한다는 장점을 활용해 과학개념 학습, 탐구활동 및 실험수행의 보조적 역할 등을 수행할 수 있으나, 대부분의 챗봇은 제한된 조건에만 반응하는 규칙기반 모델을 활용한 기초적 기능을 활용한 교수학습 자료 개발에 초점이 맞추어져 있는 실정이다.

과학교육에서 인공지능 챗봇의 활용이 미비한 원인은 다양하게 존재할 수 있지만, 규칙기반 인공지능의 한계로 인해 제한적 상황에서만 작동하는 점, 확장성을 위해서는 별도의 메타 데이터 라벨링을 요구하는 점 등이 주요 원인일 수 있다. 반면, 생성적 인공지능인 ChatGPT는 비지도학습 모델을 통해 웹상의 다양한 전문적 데이터를 학습하고 인간과 동일한 방식으로 대화하며, 인간이 만들어낸 것과 유사한 텍스트를 완성하므로 이를 활용하여 교사와 학생의 상호작용 같은 유사 경험 제공이 가능하다. 기존의 챗봇은 미리 입력된 문장으로 답하기, 단순한 단어의 조합을 통한 답변, 웹상의 데이터 검색 결과를 제시하기만 하며, 데이터에 대한 분석, 요약, 판별은 사용자의 몫이었다. 그러므로 챗봇이 제공하는 결과물에 대한 활용도와 신뢰도가 낮은 편이며, 인간이 직접 웹 브라우저를 통해 검색하는 것에 비교할 때 챗봇 활용 결과물의 만족도가 높지 않았다. 그러나 ChatGPT에 의해 생성된 결과물은 사용자가 원하는 요구사항인 프롬프트에 포함된 의미 맥락, 단어와 개념의 관계를 파악하기 때문에 맞춤형 답변이 가능하며, 생성적 적대 모델을 거친 결과물은 인간이 별도로 분석, 요약, 선별하는 과정을 거친 것과 유사한 수준으로 제공된다.

생성적 인공지능의 또 다른 대표적 사례인 Dall·E2는 이미지 생성 인공지능으로, 텍스트 형태로 이미지 생성을 요청하면 GPT-3 알고리즘을 통해 사용자가 입력한 문장을 이해하고 적합한 이미지를 생성한다. Dall.E2는 사용자가 입력한 텍스트에 내포된 의미 파악, 사용자가 원하는 이미지 생성이라는 단계적 처리과정을 거친다. 먼저 사용자가 텍스트 형태로 입력한 이미지 생성 요구 설명을 제로샷(zeo-shot) 구성에 필요한 이미지와 매칭하는 딥러닝 모델인 대조적 언어-이미지 사전 훈련(CLIP: Contrastive Language-Image Pre-training) 모델을 이용하여 픽셀로 전환한다(Ramesh et al., 2022). CLIP는 자연어 처리 모델로써 이미지와 텍스트 인코드에 대해 사전 훈련을 통해 사용자가 입력한 텍스트 데이터의 단어 세트와 일치도가 높은 이미지를 예측하여 제로샷을 분류하는 기능을 한다. 다음으로 확산모델 신경망을 이용하여 무작위 선택된 픽셀로 구성한 왜곡 이미지를 CLIP에 적합한 이미지로 전환한다(Radford et al., 2021).

Dall.E2는 사용자의 요구를 파악하여 객체의 속성에 부합하는 이미지를 생성 및 수정할 수 있으며, 여러 가지 속성과 공간 관계를 동시에 제어할 수 있어 ‘파란모자, 빨간장갑, 초록색 셔츠, 노란 바지를 입은 펭귄 이모티콘’과 같은 요구를 처리하여 이미지를 생성할 수도 있다. 또한 객체의 3D 렌더링과 ʻ어안 렌즈 보기’ 같은 광학적 왜곡을 적용할 수 있으며, ʻ엑스레이’와 같은 다양한 필터링을 적용하여 객체의 내˙외부 구조화가 가능하다. 뿐만아니라 디자인이나 인테리어 등의 표현을 위해 아이디어 수준의 텍스트를 미리 구성하는 프로시딩을 구현할 수도 있다. 그러나, Dall.E2가 생성하는 이미지는 픽셀 선택 과정부터 모델이 자체적으로 생성한 것이며, 최종 생성 이미지는 실제 세계에 존재하지 않는 것이므로 과학적 모델 이미지 또는 생물 이미지 같은 전문적 정보를 포함하는 이미지 생성은 오개념 유발 등의 문제점으로 인해 제한적일 것이다. 그러므로 교육에 생성적 인공지능을 활용하기 위한 방향성을 탐색하는 과정에는 좀 더 명확한 결과물을 제시하는 ChatGPT를 위주로 고찰하였다.

생성적 인공지능은 사전 훈련과정에서 필터링을 어떻게 적용하는가에 따라 결과가 달라지므로, 개발사에서는 문제점을 억제하기 위해 증오, 괴롭힘, 폭력, 자해, 불법 활동, 속임수, 정치, 스팸, 공공 및 개인건강, 성적이거나 충격적 내용은 제공하지 않도록 필터링을 적용하였다고 안내하고 있다(OpenAI, 2023). 인공지능에 의해 생성된 결과물에 대한 모니터링 및 개선에 대해 공지하고 있지만, 고정관념 또는 편견, 시각적으로 동일하지만 언어적으로 다른 표현, 가짜 콘텐츠 생성 등으로 인한 왜곡 사례에 대한 수정은 지속적으로 개선해 나가야 하는 부분이다. 이러한 이유로 인해 13세 미만의 경우 개인정보 제공과 접근을 제한하고 있으며, 18세 이상만 가입 및 사용이 자유로우며 다른 사람이나 기관을 대신하여 서비스를 이용할 경우 적합한 절차를 거쳐야 한다.

Application of Generative AI in Biology Education

과학분야 중에서도 생명과학은 생명체를 대상으로 하고 있어 거시적 관점과 미시적 관점에 따라 설명의 초점이 달라질 수 있으며, 생물 종의 계통분류학적 관계, 생물과 환경의 상호작용 등 다양한 측면을 동시에 고려해야 한다(Mayr, 1997). 다차원적 관점을 고려해야 하는 생명과학 개념학습과 역동적이고 개별적 특성을 지닌 생물체를 대상으로 하는 학습 및 탐구활동에 대한 보조 도구로써 생성적 인공지능을 활용한다면 다양한 교수 · 학습적 장점과 효과를 기대할 수 있을 것이다. 이러한 관점에서 현재 정식 서비스 중인 ChatGPT를 생명과학 개념학습과 탐구활동에 활용할 수 있는 몇 가지 사례를 제시하고 생물교육 영역에 생성적 인공지능의 활용이 가능하므로, 이에 대한 활용 방안을 제안하고자 하였다.

특히, ChatGPT는 컴퓨터 및 모바일 기기에서도 사용이 가능하며 회원가입을 거친 후 자유롭게 사용이 가능하고, API를 발급 받을 경우 개발자로서 활용이 가능하다. 그래서 이 연구에서는 프롬프트 입력, 결과물 확인 및 프롬프트 교정의 절차로 입력과 출력의 과정을 수행하였으며, 대화내용은 자동 저장되어 동일 채팅창 내의 답변에 영향을 줄 수 있으므로 새로운 주제에 대한 응답을 얻기 위해 별도의 새로운 채팅창을 사용하였다(Fig. 2).

http://dam.zipot.com:8080/sites/BDL/images/N0230130101_image/Fig_BDL_13_01_01_F2.png

Fig. 2. Process of using ChatGPT for biology learning

Case Ⅰ: Interaction with ChatGPT on Biological Concept

생명과학 지식과 개념에 대한 ChatGPT의 생성적 결과물을 확인하기 위해 Walter Cannon의 생물학적 자기조절(Biological Self-Regulation)에 대한 설명을 연구자가 각각 개별적으로 요청하였으며, 입력된 동일한 질문형 프롬프트에 대한 ChatGPT의 답변은 Table 1, 2와 같이 나타났다. 첫 번째 프롬프트에 대한 답변은 과학적으로 타당한 수준에 해당하나, 사용자에 따라 다소 다른 용어와 문장구성을 보였다. 생물학적 메커니즘에 대한 두 번째 질문형 프롬프트에서 연구자에 대한 응답이 서로 다르게 나타났으며, 유사한 형태의 답변을 위해 두 번째 프롬프트를 수정한 결과 내용은 유사하지만 문장 구성에 차이가 존재하였다.

Table 1. Responses of ChatGPT to question type prompt 1 about the Cannon’s biological selfregulation

http://dam.zipot.com:8080/sites/BDL/images/N0230130101_image/Table_BDL_13_01_01_T1.png

생성적 인공지능인 ChatGPT를 이용하여 생물학적 개념에 대한 질문형 프롬프트를 입력할 경우 과학적으로 적합한 수준의 답변을 제시하고 있으나, 사용자의 반응이나 입력 프롬프트에 따라 알고리즘을 거쳐 생성되는 문장의 구성이나 내용에 차이가 나타날 수 있다. 이러한 특성은 생성적 인공지능에서 사용하는 모델의 특징에 기인한 것으로 직접 질문형 프롬프트를 입력할 경우 동일한 내용이라도 사용자에 따라 유사하지만 동일하지 않은 답변이 제공될 수 있으며, 현재 제시된 답변이 다른 사용자에게 동일하게 제시되지 않는 경향성을 지닌다. 첫 번째 개방형 프롬프트에 대한 답변은 사용자에 따라 다소간의 차이만 존재할 뿐 형식이나 내용은 전반적으로 유사한 것이었다. 그러나, 두 번째 프롬프트에 대한 답변은 사용자에 따라 확연히 다른 차이를 나타내었다. 구조화된 프롬프트 제시를 통해 유사 형태의 답변구성을 유도할 수 있었지만, 역시 완전히 동일한 내용이나 용어 조합을 제공하지 않았다.

이러한 결과는 생성적 인공지능을 활용하여 생물학 지식에 대해 대화형으로 상호작용할 경우 사용자와 상호작용한 학습 결과가 반영되므로, 사용자 맞춤형 학습이 가능할 수 있음을 시사한다. 또한 인공지능에서 제시되는 답변이 사용자의 목적이나 요구에 적합한지 판단하여 질문 또는 요청을 위한 프롬프트를 점진적으로 구체화할 수 있으므로, 인공지능과의 대화 과정 자체가 개념을 구체화하는 학습과정으로 활용될 수도 있음을 의미한다. 다만, 질문이나 요청에 대한 프롬프트를 영어로 입력할 경우 과학적 개념의 정확도가 높은 편이나, 영어 외 언어를 사용할 경우 전문적인 내용에 대한 답변은 일부 부정확한 오개념, 비문, 사용되지 않는 용어를 제시하기도 한다. 그러므로 ChatGPT를 활용하여 정확한 과학적 답변을 얻고자 할 경우, 현재 시점에는 한국어로 의사소통하는 것보다 영어를 기준으로 의사소통하는 것이 효과적일 수 있다. 최근 크롬 브라우저의 확장프로그램을 통해 프롬프트 작성 가이드, 음성 대화, 자동번역 등의 기능 활용이 가능하나, 정확성과 광고 포함, 계정 생성 유도 등의 문제로 인해 교육적 활용을 위해서는 적절한 검토가 선행되어야 한다.

Table 2. Response of ChatGPT to question type prompt 2 about the Cannon’s biological selfregulation

http://dam.zipot.com:8080/sites/BDL/images/N0230130101_image/Table_BDL_13_01_01_T2.png

과학적 개념에 대한 상호작용에서 한발 더 나아가, 생명과학 개념 학습측면에서 학생이 지니고 있는 직관개념을 ChatGPT에게 제공할 경우 과학적으로 옳은 것인지에 대한 피드백을 제공받을 수 있다. ʻ식물은 물을 먹고 산다.’라는 문장이 과학적으로 옳은 것인지에 대한 질문형 프롬프트를 입력할 경우 ʻ섭식의 개념은 식물에게 적용하기 어려우며, 뿌리를 통해 물을 흡수하여 광합성 과정에 사용하므로 생존에 필수적이지만 자원을 소비하는 것처럼 표현할 수 없다’는 답변을 제시한다. 그러나 동일한 내용을 영어가 아닌 한국어로 제시하면 과학적으로 옳은 문장이라고 답변한다.

‘움직이는 것은 동물이고, 움직이지 않는 것은 식물이다.’라는 내용에 대해서도 영어에 비해 한국어로 작성할 때 부정확한 답변이 제시되는 현상이 나타났다. 해당 프롬프트를 영어로 작성할 경우 ʻ과학적으로 옳지 않다.’는 답변과 함께 식물의 생장이나 굴광성 같은 사례를 제시하며 적절한 설명을 제시하지만, 한국어로 입력할 경우 과학적으로 옳지 않다는 내용을 설명하는 사례로 ʻ파충류나 소파종은 이동하지 않는다.’, ʻ고양이풀은 이동이 불가하지만 식물이 아니다.’와 같은 부적절한 설명이 제시되기도 한다. 그러므로 학습자의 직관개념에 대한 과학적 검증에 인공지능을 사용할 수도 있으나 현재는 한국어로 상호작용 할 경우 일부 결과물의 신뢰도 문제가 존재하므로, 영어 문장으로 명확하게 구조화하고 결과물의 진위에 유의하여 사용할 필요가 있다.

Case Ⅱ: Interaction with ChatGPT about the Biological Inquiry

생명과학 탐구에 있어 ChatGPT의 보조적 역할 수행 가능성을 탐색하기 위해 초등학교 과학교육과정 3~4학년 군에 제시된 탐구활동에 대한 실험설계를 요구하였다. 일반적인 학습자 수준에서 사용이 가능한지 확인하기 위해 구글의 번역기능을 사용하여 입력한 내용에 따라 제공된 결과는 Table 3과 같이 나타났다. 첫 번째 입력 내용은 과학과 교육과정에 제시된 탐구활동 주제 ʻ씨가 싹트거나 자라는데 필요한 조건 찾기’에 대한 실험을 설계해달라는 내용이었다. 이에 대해 ChatGPT는 주어진 주제를 고려하여 실험설계 과정을 단계별로 구분하여 제시하였으며, 실험환경을 고려함과 동시에 전문가의 도움을 권고하는 유의사항도 안내하였다.

Table 3. Response of ChatGPT to request about the experiment design

http://dam.zipot.com:8080/sites/BDL/images/N0230130101_image/Table_BDL_13_01_01_T3.png

첫 번째 답변은 일반적이고 개략적인 수준이었기 때문에 실험을 수행하기 위해서는 ʻ씨앗’과 ʻ조작변인’의 선택이 필요하므로, 두 번째 입력 프롬프트에 씨앗 종류는 ʻ강낭콩’으로, 조작변인은 ʻ빛’을 추가하여 재작성을 요구하였다. 두 번째 답변에서는 첫 번째 답변에 각 조건을 단순 추가하는 수준으로 제시하였으므로, 더 상세한 실험계획을 추가로 요구하였다. 세 번째 답변에서는 구조화된 실험계획서를 제공하였으며 재료의 수량, 실험군과 대조군에 대한 처리, 관찰방법, 자료 수집 및 분석, 결론 도출 및 의사소통 방법에 대해 상세히 제시하였다.

앞서 제시한 사례와 같이 ChatGPT을 활용할 경우 빠르게 탐구활동의 절차를 확인하고 실험에 대한 계획서를 작성할 수 있다. 그러나 학습자 수준에서는 탐구요소와 과정에 대한 학습이 필요하며 직접 탐구과정을 수행하는 체험적 경험이 필수적이므로, 탐구 설계 및 분석과정 전체를 인공지능에게 의존하는 것은 과학탐구 학습의 측면에서 적절치 않을 수 있다. 반면, 인공지능을 활용한다면 학습자가 실험이나 탐구활동을 설계하는 과정에서 전문적 정보를 검색하고 확정하는데 소요되는 시간의 절약과 효율성을 제고할 수 있다. 또한 실제 탐구활동을 수행하기 전에 학습자가 설계한 내용과 인공지능의 결과물을 비교함으로써 탐구 설계, 수행, 분석에 대한 자기주도적 검토 및 수정보완을 위한 보조 수단으로 인공지능을 활용할 수 있을 것이다.

ChatGPT를 활용하여 특정 실험과 관련하여 필요한 재료 및 장비, 안전사항에 대해 빠르고 쉽게 원하는 정보를 제공받을 수도 있다. ʻDNA 전기영동에 필요한 재료가 무엇인가?’라는 프롬프트에 대해 전기영동 장치, 아가로스 겔, 완충액(Tris-borate-EDTA), 로딩 버퍼(butter), 마이크로피펫, 피펫 팁, DNA 샘플, 전원 공급 장치, UV transilluminator, 겔 문서화 시스템, 오토클레이브 또는 전자레인지를 제시하고, 각각의 사용법이나 예시를 함께 제공하였다. 또한 ʻ이런 실험재료와 도구를 다룰 때 주의해야 하는 안전사항이 무엇인가?’라는 내용에 대해 EtBr, UV, 전기영동 장치, 완충액, 오토클레이브 사용 시 유의사항과 안전조치 사항을 간략히 제시하였으며, 폐기물 처리에 대해서도 언급하였다. 좀 더 상세한 조치방법을 요구하면 관련된 내용과 함께 지역적 특징을 고려하라는 안내가 함께 제시되며, ʻUV 차단 안경으로 일반 선글라스를 사용하려고 한다’는 틀린 내용이 포함된 프롬프트를 입력할 경우 안전에 위배된다는 내용을 정확하게 답하는 것과 함께 해당 기구의 필수적인 최소 규격, 구매 방법, 구매처 등에 대한 정보도 제시하였다.

뿐만 아니라 과학과 교육과정에 제시된 ʻ광합성에 영향을 미치는 환경 요인 탐구하기’와 관련된 실험의 독립변인과 종속변인을 구분하여 실험 데이터를 제공하고 엑셀 프로그램을 이용한 표와 그래프로 변환할 것을 요구하였다. 이에 대해면 엑셀 프로그램에 붙여 넣을 수 있는 수준으로 결과물을 생성하였으며, 결과에 대한 해석 내용과 함께 실험의 상황과 조건 등을 좀 더 면밀히 검토해야 한다는 유의사항도 제공하였다.

따라서 ChatGPT을 활용하면 실험수행 전 안전 유의사항에 대한 확인뿐만 아니라 사용자가 계획한 내용에 대한 보완사항의 검토를 요구할 수도 있으며, 실험 기구 등의 준비방법과 적합한 규격에 대한 정보도 제공받을 수 있다. 그러므로 탐구 및 실험설계 절차, 안전사항 및 조치방법, 실험재료 및 도구 사용법, 결과 분석법 등에 대한 검토와 확인을 위한 보조적 수단으로 활용한다면 참고자료 탐색 및 선별에 소요되는 시간을 줄이고 전문가 없이 인공지능의 도움을 받아 학습자가 자기주도적으로 탐구활동 수행이 가능할 수 있다.

Application Guide & Direction of Generative AI in Biology Education

Application Guide of Generative AI in Biology Education

생성적 인공지능의 활용은 학습자가 직접 프롬프트를 입력하고 상호작용함으로써 학습 경험을 개인에게 맞추어 제공할 수 있다는 장점을 지니고 있다. 특히 직관 개념을 지니고 있는 학습자나 특정 개념을 학습하는데 어려움을 겪고 있는 학습자에 대한 피드백을 교사가 맞춤형으로 제시하기 어려운 현실과는 대조적으로, 인공지능은 학습자가 자기주도적으로 학습할 수 있도록 개인에게 적합한 설명을 제공할 수 있다. 또한 인공지능은 탐구활동의 계획과 수행의 보조자로 기능함으로써 메타인지적으로 탐구과정을 검토하기 어려운 영역에서도 학습자에게 도움을 제공할 수 있다. 무엇보다도 학습자 개인에게 초점을 맞춘 상호작용과 피드백은 학습을 지속하도록 하는 동기유발 요인으로 작용할 수 있으며, 활동 내용이 지속적으로 저장되고 인공지능이 학습함으로써 활동을 수행할수록 더욱 개인에 맞는 결과물을 제공할 수 있을 것이다. 그러나 ChatGPT와 Dall.E 2 같은 생성적 인공지능은 다양한 장점과 함께 윤리적 문제를 지니고 있으며, 기존의 인공지능과 달리 실제와 유사하지만 실존하지 않는 결과물을 생성한다는 측면에서 새로운 유의사항들에 대한 검토가 필요하다.

최근 활성화되고 있는 챗봇을 이용한 과제작성, 보고서 작성 등의 문제가 증가하고 있으며, 교수자가 기술적 도움없이 인공지능에 의해 생성된 문장이나 글을 식별해내는 것은 매우 어려운 수준이다(Bretag et al., 2019). ChatGPT를 통해 생성한 글은 별도의 인공지능 판별자를 거치지 않으면 인공지능이 작성한 것인지 사람이 작성한 것인지 구분하기 어려운 실정이다. 물론, 개발사에서는 정책적으로 18세 미만의 경우 가입과 사용이 제한하고 있으므로, 미성년자의 활용은 어렵다고 볼 수 있으나 성년에 도달한 학생이나 교사는 자유롭게 사용이 가능하다. 그러므로 과제 수행, 프로젝트 활동, 글쓰기 및 발표자료 제작 등 서면으로 제출하는 방식으로 이루어지던 평가방법들은 개선되어야 할 필요가 있다.

생성적 인공지능의 알고리즘은 최대한 실제와 유사한 가상의 자료를 만들어내는 것이므로, 평가자는 인공지능이 생성한 것인지 평가대상자가 생성한 것인지 구분하기 어려울뿐만 아니라 현재 제시된 판별 프로그램들이 완벽하지 않기 때문에 교수자와 학생의 논쟁을 유발할 수 있다(Preeti et al., 2023). 현재는 생성적 인공지능의 활용이 전적으로 사용자의 선택과 책임으로 규정되어 있으나, 사용규제를 통한 인공지능 활용 차단은 실효성이 낮을 뿐만 아니라 인공지능 시대를 살고 있는 시점에 적절치 않은 방안일 것이다. 그러므로 인공지능의 개입으로 인해 발생하는 평가의 어려움을 극복하기 위해서는 짧은 과학적 서술이나 구두 발표, 객관화된 탐구활동의 직접적 수행에 대한 평가에 초점을 맞추는 등 양적 평가보다 질적 평가로의 전환이 필요하다. 인공지능은 창의성과 비판적 사고, 협업을 통한 프로젝트 활동의 상호작용을 대체하도록 프로그래밍 되지 않았으므로, 학습자의 전반적인 역량과 전문적인 소양을 평가하기 위한 개선이 요구된다.

더 나아가, 2023년 3월 Chat GPT 개발회사인 Open AI는 기존 GPT-3.5 모델 기반 Chat GPT를 GPT-4 모델을 기반으로 개선하였다. GPT-4 기반 Chat GPT는 좀 더 복잡한 요구 처리, 긴 맥락의 프롬프트에 대한 세부 분석 가능, 그림 입력 및 분석 가능 등의 기능이 개선되었다. 한마디로, 이전 버전에서 텍스트 모달만 지원하던 것을 텍스트는 물론이고, 이미지 등을 통한 멀티모달 지원이 가능하다. 기존 GPT-3.5 모델은 텍스트만 사용 가능했으나, GPT-4 모델은 텍스트, 음성, 이미지, 영상 등도 입력 및 출력이 가능하게 된 것이다. 이외에도 GPT-4 모델은 안전 사항 및 윤리 문제 등에 대해서 훨씬 개선되었으며, 지원 언어를 영어 중심에서 한국어를 포함한 26개 언어로 확장하였고, 메모리 능력인 최대 토큰수도 확장하여 제공하고 있다. 이러한 기능을 효과적으로 활용한다면 교수학습에 더욱 효과적으로 활용이 가능하다. 다만, 현재 GPT-4 모델은 유료 정책을 따르므로 교수학습 목적으로의 활용에는 다소 제한성 지닐 수 있다.

Application Direction of AI for Biology Education

머신러닝, 딥러닝과 같은 인공지능 기술의 변혁에 따른 인공지능의 양적 성장과 함께 최근에는 이전에 불가능하다고 여겨지던 것들이 구현되고 있으며, 인공지능의 기능 개선과 활용 영역 확장 속도는 일반 대중이 따라가기 어려울 정도로 빠른 실정이다(Guan et al., 2020; Molenaar, 2021). 딥러닝부터 생성적 인공지능에 이르기까지 인공지능 분야는 급변하고 있으며, 이와 함께 에듀테크 분야 역시 변화에 직면하고 있으므로 이와 관련한 교수 · 학습적 관점의 검토가 필요하다. 이러한 관점에서 생성적 인공지능인 ChatGPT를 활용한 생물 개념학습 및 탐구활동을 위한 문헌고찰 결과 및 사례를 제시하였으며, 실제 활용 사례에 기반하여 생성적 인공지능 활용 교수 · 학습과정을 탐색 및 결정, 정교화 및 생성, 검증 및 해석, 의사소통 및 정리와 같이 제시할 수 있었다(Fig. 3).

http://dam.zipot.com:8080/sites/BDL/images/N0230130101_image/Fig_BDL_13_01_01_F3.png

Fig. 3. Teaching & learning model based on application example by using generative AI

탐색 및 결정 단계에서는 학습자나 교수자가 학습 주제를 탐색함으로써 문제를 발견하거나 학습내용을 인식함으로써 학습활동이 시작되며, 이어지는 학습활동에 적합한 생성적 인공지능을 탐색하고 활용에 적합한 유형이 무엇인지 결정한다. 생성 및 정교화 단계에서는 학습활동에 활용하기 위해 입력하는 초기 프롬프트를 텍스트로 구성하고, 인공지능으로부터 획득한 초기 아이디어나 답변을 검토하여 학습자가 원하는 내용이 명확히 포함되어 있는지 검토한다. 검토 결과를 바탕으로 인공지능에게 제시하는 프롬프트의 내용을 수정 · 보완하여 다시 제시하고 검토 및 수정하는 과정을 반복하여 생성된 내용을 정교화함으로써 학습자가 주제와 관련된 내용을 학습하고 메타인지적으로 확인하는 과정을 수행한다.

검증 및 해석단계에서는 정교화한 아이디어를 검증하기 위한 활동을 수행하며, 인공지능을 활용하여 검증과정에 대한 절차수행과 안전사항 등에 대한 정보를 얻을 수 있다. 생성적 인공지능은 입력 프롬프트가 언어적으로 제공되면 내포된 단어들의 관련성을 파악하여 결과물인 답변을 만들어내기 때문에 사용자가 원하는 답변을 얻기 위한 프롬프트를 처음부터 완벽하게 입력하는 것은 어려울 수밖에 없다. 그러므로 프롬프트의 입력에 따라 생성된 답변에 대해 사용자가 가치판단을 거쳐 프롬프트의 텍스트를 교정하여 피드백 하는 연속적 상호작용을 통해 출력되는 결과물의 내용과 입력되는 내용을 상호 검토해야 한다(Chatterjee & Dethlefs, 2023). 앞서 살펴본 ‘DNA 전기영동’ 사례에서 실험도구로 제시된 UV보안경에 대해 일반 선글라스 활용 가능 여부에 대한 답변을 요구하면 필요한 전문규격과 사용법을 제공 받을 수 있었으며, 동시에 사용자의 요청에 따라 구매방법도 제공 받을 수 있었다. 인공지능을 보조적 도구를 활용하여 아이디어 검증 과정을 정교화하면, 학습자는 활동의 각 시점별로 적합한 전문정보에 좀 더 쉽게 접근할 수 있게 된다. 또한 아이디어 검증에 따른 데이터를 수집하고 수집된 데이터를 인공지능에게 제공하면, 표나 그래프로 전환해서 제공하거나 데이터 변환 방법에 대한 상세한 조언을 제공 받을 수 있다. 뿐만 아니라 검증 결과를 바탕으로 학습자가 가치 판단을 하기 위해 인공지능에게 추가 검증활동이나 데이터 해석상의 부족한 부분들에 대해 검토 사항을 요구할 수도 있다.

의사소통 및 정리단계에서는 학습자가 인공지능을 활용하여 활동결과를 표현하기에 적합한 의사소통 아이디어를 제공받고, 정교화함으로써 의사소통에 필요한 방법과 정보를 빠르고 효과적으로 획득할 수 있다. 또한 학습자가 작성하거나 표현한 발표나 공유를 위해 구성한 내용에 대해 교정 및 검토가 가능하며, 간략히 요약하거나 조직화한 결과를 제공받을 수 있어 발표나 공유과정에 대한 조력을 받을 수 있다. 인공지능에게 ʻ씨가 싹트거나 자라는데 필요한 조건 찾기’에 대한 가상 실험 결과를 제공하고 적합한 의사소통 방법을 요구하면 보고서, 포스터, 저널 발표와 같은 답변을 제공하며, 세부적인 구성에 대한 요청에도 관련 안내를 제공 받을 수 있다. 생성적 인공지능을 활용할 경우 사용자가 입력한 내용의 오류를 빠르고 정확하게 발견할 수 있으며, 정교화 과정을 보조할 수 있으므로 사용자인 학습자와 교수자는 자신의 과학적 추론과 해석에 대한 의사결정에 확신을 가질 수 있게 된다(Chatterjee & Dethlefs, 2023; Lim et al., 2023). 그러므로 의사소통 단계에서 인공지능을 활용함으로써 동료 검토나 전문가 검토와 유사한 경험을 제공받을 수 있다.

이상과 같이 생성적 인공지능을 활용하여 학습을 수행하는 전략을 단계별로 진행하기 위해서는 학습자가 인공지능과 효과적으로 상호작용할 수 있는 역량을 지니고 있어야 한다. 또한 생성적 인공지능의 활용을 준비하고 마무리하는 모든 과정에서 인공지능 활용에 대한 윤리적 관점을 끊임없이 재인하고 유지하는 교수학습 전략이 함께 제시되어야 한다. 사용자가 윤리적 측면에서 부정적 의도성을 지닐 경우 인공지능을 전적으로 이용하여 보고서를 작성하거나 왜곡된 결과를 생산할 수 있으며, 사용자가 직접 구성한 것처럼 사용하는 부정을 저지를 여지도 있다(Lim et al., 2023; O'Connor & CahtGPT, 2022).

따라서 생성적 인공지능의 교육적 활용을 위해서는 첫째, 학습자나 교수자를 포함하는 사용자가 인공지능을 활용하는 측면에서 윤리적 판단을 어떻게 할 것인지에 대한 교수 · 학습적 측면에 대한 연구가 필수적이다. 둘째, 사용자가 인공지능에 전적으로 의존하지 않고 효과적으로 적절한 시점에 사용할 수 있도록 안내하는 교수학습 전략의 개발이 필요하다. 셋째, 인공지능이 제공하는 결과물이 과학적으로 적합한 것인지, 윤리적으로 적절한 것인지 등에 대한 의사결정 방안과 역량 개발을 위한 연구가 수행되어야 한다.

Authors Information

Byeon, Jung-Ho: Bukpyeong Girls’ High School, Teacher, First Author

Kwon, Yong-Ju: Korea National University of Education, Professor, Corresponding Author

References

1 Adams, D., & Chuah, K. M. (2022). Artificial intelligence-based tools in research writing: Current trends and future potentials. In P. P. Churi., S. Joshi., M. Elhoseny., & A. Omrane. (Eds.). Artificial Intelligence in Higher Education (pp. 169-184). FL: Boca Raton.  

2 Bommarito, M.J., & Katz, D.M. (2022). GPT Takes the B,.ar Exam. ArXiv, abs/2212.14402.  

3 Bonfield, C. A., Salter, M., Longmuir, A., Benson, M., & Adachi, C. (2020) Transformation or evolution?: Education 4.0, teaching and learning in the digital age. Higher Education Pedagogies, 5, 223-246.  

4 Bretag, T., Harper, R., Burton, M., Ellis, C., Newton, P.M., Rozenberg, P., ... van Haeringen, K. (2019). Contract cheating: A survey of Australian university students. Studies in Higher Education, 44, 1837–1856.  

5 Chang, J. A., Lim, I. S., & Hong, O. S. (2021). The features of science inquiry using artificial intelligence, internet of thins, big data and extended reality: Focusing on the IDEA-type science teacher research group. School Science Journal, 15, 407-422.  

6 Chatterjee, J., & Dethlefs, N. (2023). This new conversational AI model can be your friend, philosopher, and guide and even your worst enemy. Patterns, 4, 1-3.  

7 Goodfellow, I.J., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., ... Bengio, Y. (2020). Generative adversarial networks. Communications of the ACM, 63, 139 – 144.  

8 Goodfellow, I. J., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., ... Bengio, Y. (2014). Generative Adversarial Nets. NIPS. ArXiv, abs/1406.2661.  

9 Google (2023). Google Trends. Retrieved from https://trends.google.com/trends/  

10 Guan, C., Mou, J., & Jiang, Z. (2020). Artificial intelligence innovation in education: A twenty-year data-driven historical analysis. International Journal of Innovation Studies, 4, 134-147.  

11 Haderer, B., & Ciolacu, M. (2022). Education 4.0: Artificial intelligence assisted task-and time planning system. Procedia Computer Science, 200, 1328-1377.  

12 Henlein, M., & Kaplan, A. (2019). A brief history of AI: On the past, present, and future of artificial intelligence. California Management Review, 61, pp 5-14.  

13 Holmes, W., Bialik, M., & Fadel, C. (2019). Artificial Intelligence in Education: Promise and Implications for Teaching and Learning. MA: Center for Curriculum Redesign.  

14 Hwang, G. J., Xie, H., Wah, B. W., & Gasevic, D. (2020). Vision, challenges, roles and research issues of artificial intelligence in education. Computer & Education: Artificial Intelligence, 1, Article 100001.  

15 Jang, J. A., Park, J. H., & Park, J. S. (2021). An analysis on the trends of education research related to ‘artificial intelligence chatbot’ in Korea: Focusing on implications for use in science education. Journal of Learner-Centered Curriculum and Instruction, 21, 729-743.  

16 Kingma, D.P., & Welling, M. (2013). Auto-Encoding Variational Bayes. CoRR, abs/1312.6114.  

17 Kung T. H., Cheatham, M., Medenilla, A., Sillos, C., & De Leon, L. (2023) Performance of ChatGPT on USMLE: Potential for AI-assisted medical education using large language models. PLOS Digital Health, 2, e0000198.  

18 Lim, W. M., Gunasekara, A. N., Pallant, J. L., Pallant, J. I., & Pechenkina, E. (2023). Generative AI and the future of education: Ragnarök or reformation? A paradoxical perspective from management educators. The International Journal of Management Education, 21, 100790.  

19 Mayr, E. W. (1997). This Is Biology: The Science of the Living World. MA: Harvard University Press.  

20 Menon, H. K. D., & Janardhan, V. (2021). Machine learning approaches in education. Materialstoday: PROCEEDINGS, 43, 3470-3480.  

21 Ministry of Education (2022). Comprehensive Plan for Fostering Digital Talent. Sejong.  

22 Molenaar, I. (2021). Personalisation of learning: towards hybrid human-AI learning technologies. In OECD. (2021). Digital Education Outlook 2021: Pushing the Frontiers with Artificial Intelligence, Blockchain and Robots, (pp. 57-77). Paris: OECD Publishing.  

23 OECD (2019). Artificial Intelligence in Society, Paris: OECD Publishing Paris.  

24 O'Connor, S., & CahtGPT (2022). Open artificial intelligence platforms in nursing education: Tools for academic progress or abuse? Nurse education in practice, 66, 103537.  

25 Okaibedi, D. (2023). ChatGPT and the rise of generative AI: Threat to academic integrity? Journal of Responsible Technology, 13, 100060.  

26 Oord, A.V., Kalchbrenner, N., & Kavukcuoglu, K. (2016). Pixel Recurrent Neural Networks. ArXiv, abs/1601.06759.  

27 OpenAI (2023). ChatGPT: Optimizing Language Models for Dialogue. Retrieved from https://openai.com/blog/chatgpt/  

28 Ouyang, F., & Jiao, P. (2020). Artificial intelligence in education: The three paradigms. Computers & Education: Artificial Intelligence, 2, 100020.  

29 Preeti, Kumar, M., & Sharma, H. K. (2023). A GAN-based model of deepfake detection in social media. Procedia Computer Science, 218, 2153-2162.  

30 Radford, A., Kim, J.W., Hallacy, C., Ramesh, A., Goh, G., Agarwal, S., ... Sutskever, I. (2021). Learning Transferable Visual Models From Natural Language Supervision. ArXiv, abs/2103.00020.  

31 Ramesh, A., Dhariwal, P., Nichol, A., Chu, C., & Chen, M. (2022). Hierarchical Text-Conditional Image Generation with CLIP Latents. ArXiv, abs/2204.06125.  

32 Sairete, A., Balfagih, Z., Brahimi, T., Mousa, M. E. A., Lytras, M., & Visvizi, A. (2021). Artificial intelligence: Towards digital transformation of life, work, and education. Procedia Computer Science, 194, 1-8.  

33 Shamir, G., & Levin, I. (2022). Teaching machine learning in elementary school. International Journal of Child-Computer Interaction, 31, 100415.  

34 Singer, U., Polyak, A., Hayes, T., Yin, X., An, J., Zhang, S., ... Taigman, Y. (2022). Make-A-Video: Text-to-Video Generation without Text-Video Data. ArXiv, abs/2209.14792.  

35 Su, J., & Yang, W. (2022). Artificial intelligence in early childhood education: A scoping review. Computers and Education: Artificial Intelligence, 3, 100049.  

36 UNESCO (2022). K-12 AI Curricula: A Mapping of Government-endorsed AI Curricula. Paris: UNESCO Publishing.  

37 Vincent-Lancrin, S. (2021). Frontiers of smart education technology: Opportunities and challenges. In OECD Digital Education Outlook 2021: Pushing the Frontiers with Artificial Intelligence, Blockchain and Robots, (pp. 21-47). Paris: OECD Publishing.  

38 World Economic Forum (2020). Platform for Shaping the Future of the New Economy and Society: Schools of the Future: Defining New Models of Education. Geneva.  

39 Wu, A. N., Stouffs, R., & Biljecki, F. (2022). Generative adversarial networks in the built environment: A comprehensive review of the application of GANs across data types and scales. Building and Environment, 223, 109477.  

40 Yang, S. J. H., Ogata, H., Matsui, T., & Chen, N. S. (2021). Human-centered artificial intelligence in education: Seeing the invisible through the visible. Computers and Education: Artificial Intelligence, 2, 110008.