Analysis of Research Trends in Online Discussion Using Topic Modeling

김 세화  Se-Hwa Kim1최 숙기  Sook-Ki Choi2*

Abstract

Online discussion is a major form of discourse in modern society and a teaching-learning method that is important in an online learning environment. The purpose of this study is to explore the research direction by considering the research on online discussion. The subjects of the analysis are the title, keywords, and abstracts of Academic papers from 2011 to 2020. After conducting textual analysis, conduct LDA-based topic modeling with Gibbs sampling and conduct time series analysis for analysis of research trends over the years. Seven topics were extracted through topic modeling. These are classified into two aspects, respectively: online discussion as teaching-learning methods and online discussion as online discourse forming methods. Among them, research on aspects of online discussion as teaching-learning methods in online class settings has been addressed as a relatively more important topic. According to the annual time series analysis, the research topic on online discussion as teaching-learning activity decreased, but after COVID-19, remote classes began to be introduced in earnest, and it began to increase rapidly again. On the one hand, research related to dashboard and visualization analysis for learner interaction analysis has shown a steady increase. Topics on online discussion as an act of social participation or political communication have emerged as a cold topic, while topics on discourse analysis in online communities of members of society based on online discussion have emerged as a hot topic. Based on these findings, We discussed the direction of follow-up research for the continuous and significant development of online discussion.

Keyword



Introduction

오늘날의 사회는 정보통신 기술의 발달에 따라 의사소통 매체가 변화함에 따라 새로운 미디어를 기반으로 한 의사소통의 관습과 방식의 변화가 촉발되었다. 인터넷을 기반으로 한 온라인 커뮤니케이션이 발달함에 따라 현대인들은 온라인이라는 가상의 공간을 바탕으로 의사소통을 실천해 간다. 이러한 맥락 속에서 온라인 토론(Online discussion)은 현대 사회의 주요한 담화 양식 중 하나로 부상하게 된 것이다.

현대인들은 온라인 공간에서 소통함으로써 새로운 커뮤니케이션의 경로를 구축하고 사회적 네트워크를 형성해간다. 온라인 기반의 사회적 네트워킹은 온라인 토론이라는 담화 방식을 수행하는 가운데 실현되며, 구성원들은 사회적 이슈에 대해 적극적으로 소통하며 이슈에 대응하고 관련 현안 문제를 해결하는 데 참여하는 기반을 형성하는 토대가 된다고 볼 수 있다(Hobbs, 2010). 온라인 공간이 현대 사회의 주요 공론장으로 기능하면서 온라인 커뮤니케이션의 대표적인 방식인 온라인 토론을 통한 담론 구성 기능에 대한 중요성 역시 부각되었음을 확인할 수 있다.

2020년 전세계적으로 확산된 코로나 19로 인해 교육계와 학교 현장은 획기적 변화의 기로를 맞이하게 되었다. 전염병의 확산 방지를 위한 사회적 거리 두기의 일환으로 학교의 개학과 등교가 연기되었고 전통적인 대면 수업으로 운영되어 왔던 학교 수업 방식은 교수자와 학습자가 비대면의 수업 상황에서 실시간 혹은 비실시간 상호작용 방식을 통해 교수 학습을 실시하게 되었다. 학교 현장의 주도적인 수업 방식으로 부상한 원격 수업의 등장은 학교 현장의 수업에서 비대면의 원격 수업을 전제한 수업 설계 및 실천 방안에 대한 새로운 모색을 요구하기 이르렀다.

교육부는 2020년 8월 6일 안정적인 학교 교육과 학사 운영 실행을 위한 「2020학년도 2학기 학사운영 세부 지원 방안」을 발표하면서 학교 실정에 맞는 유연하고 탄력적인 형태의 블렌디드 러닝 기반의 수업 운영과 블렌디드 러닝(Blended learning) 기반의 교수 학습 모형 개발 및 적용에 관한 세부 정책들을 후속적으로 수립해가기 시작했다. 코로나 19와 유사한 혹은 그 외의 다양한 사유로 인해 발생할 수 있는 학업 공백의 문제를 예방하고, 학생들에게 학업 지속의 기회를 제공하여 주도록 하는 온라인 기반의 원격 수업의 방안이나 교수 학습 모형에 관련한 탐색은 필수적이라 할 수 있다. 이러한 맥락에서 이에 온라인 기반의 원격 수업에서 온라인 토론은 도입 가능한 주요 교수 학습 방법에 해당한다고 볼 수 있다.

이처럼 온라인 토론은 온라인 공간에서 수행되는 현대 사회의 주요한 담화 양식이자, 온라인 학습 상황에서 핵심적으로 다루어지는 교수 학습 방법으로서 중첩적인 대상으로 다루어진다. 다만 전통적인 토론이라는 구어적 담화 양식이 커뮤니케이션 분야의 주요 연구 대상이었으며, 토론에 관한 커뮤니케이션 분야에서의 논의가 토론을 활용한 교수 학습 방법의 실현에 실질적인 영향을 미친 것을 고려한다고 할 때 담화 차원의 의사소통 분야에서의 연구와 교육학 분야에서 다루어지고 있는 온라인 토론에 관한 연구들을 총체적으로 고려하며 연구의 방향을 탐색할 필요가 있을 것으로 보인다.

이에 본 연구에서는 2011년부터 2020년까지 최근 10년간의 연구 논문을 기반으로 온라인 토론을 주제로 한 연구 논문을 수집하여 LDA 기반의 토픽모델링을 실시하고, 연도별 연구 경향 분석을 위한 시계열 분석을 실시하고자 한다. 이를 통해 국내 온라인 토론에 기반한 연구 수행 동향을 체계적으로 분석함으로써 온라인 토론에 관한 후속적인 연구 방향을 도출해보고자 한다.

Background

Concept and Characteristics of Online Discussion

온라인 토론에 관한 논의는 최근 교육공학 등의 교육 분야에서 핵심적인 교수 학습 행위로서도 다루어지고 있다. 온라인 토론이란 온라인 전자 매체를 활용하여 가상의 공간에서 특정한 주제에 대해 참여자 간에 문자 등을 통해 텍스트로 상호작용하는 담화 유형을 의미한다(Kim&Choi, 2020). 정보통신 기술을 이용하여 가상의 공간에서 메시지들을 주고 받는 상호작용 행위로서 온라인 토론에 대한 정의는 학자들마다 차이가 있지만, 온라인 학습 맥락에서 정의되는 온라인 토론은 인터넷 등의 온라인 전자 매체를 활용하여 시공간적으로 분리된 교수자나 학습자, 혹은 학습자 간에 동시적 혹은 비동시적으로 상호작용하는 담화 행위라고 정의할 수 있다(Dillon, 1996; Hara et al., 2000).

원격 수업의 비대면 환경에서 적용할 수 있는 온라인 토론은 실시간과 비실시간 토론 유형으로 구분할 수 있는데, 웹채팅이나 화상 회의, SNS를 통해 토론 참여자가 동시에 접속하여 실시간으로 토론을 수행하는 유형과 온라인 게시판이나 전자 우편 등의 방법을 활용하여 비실시간으로 특정한 기간 내에 토론을 수행하는 방법이 존재한다. 전통적으로 온라인 토론으로 원격 수업에서 적용되는 유형은 비실시간 온라인 토론이다.

온라인 토론은 온라인을 매개로 하여 시공간적 제약을 초월하기 때문에 참여자의 범주가 훨씬 더 확장될 수 있고, 비대면의 환경에 의해 대면 상황의 의사소통에 불안을 보이는 참여자들의 심리적 부담을 보다 더 완화할 수 있고, 의견 개진의 기회도 균등하기 때문에 기존 교수 학습 방안으로 다루어져 왔던 대면 수업에서 적용된 토론에 비해 긍정적인 면이 많다고 볼 수 있다. 더욱이 문자 기반의 텍스트로 상호작용하는 특성으로 인해 자신의 사고를 더욱 정련하여 표현할 수 있는 장점이 있고 동시에 타인의 의견 역시 충분히 이해와 숙고의 시간을 통해 수용할 수 있다는 장점이 있다. 문어적 상호작용이라는 점과 비실시간의 토론이라는 측면이 결합된 온라인 토론의 경우 토론 과정에서 본인의 논증에 관한 반성적 성찰이 가능하다는 점에 의해 비판적 사고나 의사소통 능력을 촉진할 수 있다는 측면에서 장점을 지닌 교수 학습 방법이라 할 수 있다(Hara et al., 2000; Marra et al., 2004).

이에 온라인 토론(online discussion)은 대학 등의 고등교육 기관이나 평생교육이나 직업교육 분야에서 일반적으로 시행되어 왔던 e-learning 기반의 원격 수업 상황이나 MOOCs나 OCW와 같은 온라인 학습환경에서도 널리 활용하는 보편적인 교수-학습방법으로 자리매김해 왔다(Yoo, 2017).

Topic Modeling and LDA

텍스트 마이닝(Text Mining)은 텍스트 형태의 데이터를 수학적 알고리즘에 기초하여 수집·처리·분석·요약하는 연구 기법들을 통칭한다(Baek, 2017). 토픽 모델링(Topic Modeling)은 텍스트에 숨겨진 주제 구조를 탐색하는 데 사용되는 텍스트 마이닝 기법의 한 유형이다. 이는 구조화되지 않은 방대한 데이터를 대상으로 주요 주제 또는 동향을 빠르고 효율적으로 파악하는 데 유용하기 때문에 많은 학자들이 다양한 연구 분야의 동향을 파악하는 데 사용하고 있다(Hong&Choi, 2017; Kim&Kim, 2019; Kim et al., 2016).

토픽 모델링의 방법은 LSA(잠재 의미 분석), LDA(잠재적 디리클레 할당), CTM(상관토픽모형), STM(구조적 토픽모형) 등 매우 다양하다. 그중에서도 LDA(Latent Dirichlet allocation)는 토픽 모델링을 구현하는 가장 대표적인 알고리즘이다. 이 기법은 관측된 데이터를 보고 그 데이터가 어떠한 확률분포를 통해 구성되었는지를 추론하는 베이지안(Bayesian) 관점의 생성 확률 모델(generative probabilistic model)에 기반한다(Blei, 2012). LDA의 그래픽 모델은 Fig. 1과 같다.

Fig. 1에 따르면, D는 문서 집합을 나타내고, N은 문서 내 단어들의 집합을 나타낸다. K는 토픽의 수이고, 음영 처리되어 있는 노드인 Wd,n은 문서d의 n번째 단어로 문서에서 우리가 관측할 수 있는 변수이다. 그 외 음영 처리되지 않은 노드들은 잠재 노드이다. α는 θd의 값을 결정하는 디리클레 분포의 파라미터, η는 β값을 결정하는 파라미터이다. βk는 토픽 내 단어들의 분포를 나타내며, θd는 문서별 토픽의 비율, Zd,n은 문서d의 n번째 단어를 토픽에 할당하는 것이다. 즉, LDA는 관측된 단어들을 통해서 잠재된 토픽을 추론할 수 있다는 것이다.

모델링 과정을 통해 도출된 토픽에는 빈도 혹은 중요도가 높은 단어들이 포함되어 있지만 관측된 단어 자체만을 보여주기 때문에 단어들 사이의 관련성을 파악하며 토픽을 해석해야 한다(Blei, 2012).

http://dam.zipot.com:8080/sites/BDL/images/N0230110303_image/Fig_BDL_11_03_03_F1.png

Fig. 1. Graphic model of LDA (Blei, 2012. p. 81)

Method

Data Collection

본 연구에서는 온라인 토론 분야의 연구 주제를 도출하기 위하여 한국학술지인용색인(Korea Citation Index, 이하 KCI)을 활용하여 온라인 토론을 주요 키워드로 검색을 한 후 2011년부터 2020년까지 10년 간 KCI 등재지에 게재된 온라인 토론에 관한 연구 논문을 수집하였다. 웹 기반의 온라인 토론에 관한 연구는 2000년 초반부터 시행된 바 있으나, 초중등학교 단위의 온라인 수업에 관한 정책이 출발한 2011년 교육과학기술부의 스마트교육 추진전략 실행계획」을 기점으로 온라인 토론에 관한 교육 분야 연구를 총체적으로 다루기 위함이다. 이에 온라인 토론과 관련하여 수집된 논문 중 335건의 논문 중에서 비공개 논문 132건을 제외한 203개의 논문을 대상으로 하여 논문 표제어, 핵심어, 초록 정보를 바탕으로 온라인 토론과 실제 관련성이 떨어지는 103편의 논문을 제외한 총 100건의 논문을 분석 대상으로 삼았다. 수집된 논문의 연도별 발행 빈도 분석 결과는 Fig. 2와 같으며, 연도별로 평균 10편의 논문이 발행되었다.

http://dam.zipot.com:8080/sites/BDL/images/N0230110303_image/Fig_BDL_11_03_03_F2.png

Fig. 2. The number of articles from 2011 to 2020

Data Processing and Analysis Methods

수집 데이터의 전처리 과정을 통해 분석에 필요한 단위로 텍스트를 나누었다. 이를 위해 문장 부호나 특수문자, 숫자 등의 분석에 불필요한 요소들을 불용어(stopword)로 처리하였다. 또한 논문의 제목이나 초록 등에서 일반적으로 많이 노출되는 ‘연구’, ‘결과’ 등의 용어는 삭제하였고, 조사 등 역시도 불용어에 포함시켜 모두 삭제하였다. 다음으로 ‘일원 분산 분석’은 ‘일원분산분석’등으로 단어의 띄어쓰기를 통일하였고, ‘블렌디드 러닝’과 ‘혼합 학습’ 등은 ‘블렌디드 러닝’으로 통일하는 등의 유의어를 처리하였으며, 문장 내 다양한 형태는 원형 혹은 기본형으로 복원(lemmatization)하는 과정을 마지막으로 거쳤다. 본 연구에서는 형태소 분석 과정을 거쳐 명사를 최종 분석의 대상 단위로 삼았다. 명사, 동사, 형용사, 부사 등 다양한 형태소 중에서도 특히나 명사는 내용의 의미를 나타내기 때문에 텍스트의 의미 파악에 아주 유용한 단어이기 때문이다(Lee, 2014).

전처리가 완료된 DTM자료를 대상으로 하여 Gibbs 샘플링 기법을 활용하여 LDA 분석을 실시하였다. LDA 분석에서는 사전적으로 토픽 수를 결정하였다. 이 연구에서는 토픽수를 결정하는 데에는 고전적으로 사용하는 복잡도(perplexity)의 단점을 해결하기 위해 Neman et al. (2010)이 제안한 coherence score를 참고하였다. 그러나 이 결과가 연구자의 인지적 판단의 결과와 완전히 일치하는 것은 아니므로 이 측정 점수를 바탕으로 연구 목적 및 분석 결과 해석을 토대로 최종 토픽 수를 결정하는 것이 타당하다. 선행 연구들을 참조하여(Hong&Choi, 2017; Lee, 2016), 토픽 개수를 7개, 10개, 15개 등으로 분석 결과를 도출한 후 비교 분석하여 최종 7개의 토픽을 도출하였다. 이러한 과정을 거쳐 도출한 7개의 토픽별로 연결된 상위 12개의 키워드를 중심으로 하여 토픽명을 부여하였다. 마지막으로 연구 주제의 시기별 추세 파악을 통해 토픽의 시계열 연구 동향을 파악하기 위해 독립변수로는 논문의 게재 연도를, 종속변수로는 토픽의 연도별 비중 평균값을 사용하여 선형회귀분석을 수행하였다. 유의 확률 .05 수준에서 회귀계수가 음수인지 양수인지를 근거로 하여 상승 토픽(+, hot topic)과 하강 토픽(-, cold topic)을 구분하였다. 이상의 분석에는 R프로그램(4.0.4)을 활용하였다. KONLP 패키지와 tm 패키지를 활용하여 텍스트 데이터를 처리하였으며, 키워드의 빈도 분석을 수행하여 wordcloud 패키지를 활용하여 시각화였다. LDA 분석에는 topicmodels와 lda 패키지를 활용하였다.

Results

Words Frequency

논문의 제목과 초록, 주제를 포함한 전처리 과정을 거쳐 자료로부터 도출된 주요 빈출 핵심 단어 목록은 Table 1과 같다. 전체 2,351개 단어들이 분석되었다. 그 중 빈출 단어는 상위 30개를 제시하였고 빈도분석 결과 빈출 상위 100개의 핵심 단어에 대한 워드 클라우드 분석 결과는 Fig. 3과 같다. 고빈도의 단어일수록 단어의 크기가 크게 표현됨을 알 수 있다. 주요 키워드인 토론과 온라인에 관한 상위 빈도를 제외하면 ‘학습자(learner)’, ‘참여(participation)’, ‘분석(analysis)’, ‘상호작용(interaction)’, ‘활동(activity)’, ‘수업(class)’, ‘학습(learning)’ 등의 순으로 상위 빈출 단어가 나타났다.

이러한 결과를 바탕으로 할 때 온라인 토론과 관련해서는 교수 학습 상황에서 온라인 토론 활동에 나타난 참여자들의 상호작용 양상을 분석한 연구가 중심으로 이루어졌음을 확인할 수 있다. 상위 30개 빈출 단어 중 또한 ‘만족(satisfaction)’, ‘실재감(presence)’, ‘몰입(immersion)’ 등의 온라인 토론 참여에 영향을 미치는 학습자의 정의적 요인을 분석한 연구 역시 주로 이루어졌음을 확인할 수 있다.

Table 1. Top 30 words

http://dam.zipot.com:8080/sites/BDL/images/N0230110303_image/Table_BDL_11_03_03_T1.png

Note. Freq=frequency

http://dam.zipot.com:8080/sites/BDL/images/N0230110303_image/Fig_BDL_11_03_03_F3.png

Fig. 3. The number of articles from 2011 to 2020

Topics Discovered

온라인 토론에 관한 주제 및 관련 핵심 어휘를 추출하기 위하여 LDA을 기반으로 하여 분석한 결과는 Table 2와 같다. 총 7개의 토픽이 도출되었고, 각 토픽별로 빈도수를 기준으로 하여 상위 핵심 어휘 12개를 제시하였다.

Table 2. Topic modeling analysis

http://dam.zipot.com:8080/sites/BDL/images/N0230110303_image/Table_BDL_11_03_03_T2.png

Note. P=Percentage of each Topic

첫째, 토픽1은 ‘온라인 토론 학습자의 참여도와 몰입, 만족도 진단 및 영향 요인 분석(Online Discussion Learner Participation, Immersion, Satisfaction Diagnosis and Impact Factor Analysis)’으로 명명하였다. 토픽 1의 주요 키워드는 ‘학습자(learner), 만족(satisfaction), 몰입(immersion), 참여(participation), 진단(diagnostic), 효과(effect)’ 등의 키워드를 포함하고 있다. 토픽 1에서는 온라인 토론에 참여한 학습자들의 참여에서의 몰입이나 만족도, 참여도를 통하여 비대면의 온라인 상황에서 학습자들이 토론에 참여할 때 실제로 어느 정도 활동에 몰입하고 참여하며 만족하는지에 관련한 학습 특성 혹은 효과에 대한 연구들이 주로 수행되었음을 확인할 수 있다.

둘째, 토픽 2은 ‘온라인 토론 학습자의 상호작용 양상 분석을 위한 대시보드 및 시각화 분석(Dashboard and visualization analysis for analyzing aspects of online discussion learners' interactions)’으로 명명하였다. 토픽 2의 주요 키워드는 토론(discussion), 상호작용(interaction), 학습자(learner), 온라인(online), 피드백(feedback), 대시보드(dashboard), 활동(activity), 참여(participation), 분석(analysis), 개발(development), 시각화(visualization), 유형(type) 등을 포함하고 있다. 비대면으로 토론이 이루어지는 온라인 토론 활동은 면대면으로 이루어지는 토론 활동에 비해 비실재적이고 독립적인 학습 환경에서 비동시적인 토론을 포함하여 진행하므로 학습자의 상호작용을 촉진하기 위한 교수적 전략이나 방안에 대한 연구가 다수 이루어졌다. 대시보드란 온라인 토론의 활동 과정에 관한 데이터를 분석하고 이를 시각화하여 학습자들에게 제공하고 자신의 참여도나 상호작용 양상에 대한 시각화 표상화한 것을 화면으로 제시한 것을 의미한다(Few, 2006). 대시보드를 통해 제공되는 시각화 자료는 자신을 모니터링 함으로써 학습을 촉진하는 데 기여한다.

토론 게시글 수, 댓글이나 답글 수, 읽은 글의 수, 글의 길이, 접속 시간, 접속 횟수, 접속 규칙성 등과 같은 참여도 데이터나 댓글 및 답글을 쓴 관계의 정도를 대시보드를 통해 시각화함으로써 학습자들에게 피드백하는 방식들인데 학습자들에게 대시보드를 통해 어떤 유형의 정보를 어떠한 방식으로 시각화하여 제시하는 것이 학습자의 참여도나 상호작용을 증진시키는 데 인지하는 정보 유형별 시각화 방법이나 혹은 실제 대시보드를 활용한 시각화 제공이 참여도나 교육적 과정에 효과적인지에 관한 연구들이 주로 수행되었음을 확인할 수 있다.

셋째, 토픽3은 ‘온라인 토론 학습자의 참여 및 상호작용에 영향을 미치는 인지적, 사회적 실재감 효과(cognitive, Social presence effects affecting the participation and interaction of online discussion learners)’로 명명하였다. 토픽 3의 주요 키워드는 토론(discussion), 온라인(online), 사회적(social), 학습(learning), 실재감(presence), 학습자(learner), 분석(analysis), 지적(intellectual), 상호작용(interaction), 효과(effect), 스마트(smart), 참여(participation) 등을 포함하고 있다. e-learning 등의 스마트 러닝 시대에 온라인 교육이 활성화됨에 따라 학습 실재감(learning presence)이 온라인 학습 효과에 미치는 영향에 관한 연구들이 주된 연구 주제로 이루어져 있다(Garrison et al., 2001). 학습 실재감은 인지적 실재감, 사회적 실재감, 교수 실재감으로 분류될 수 있는데, 이는 학습자가 실제적인 학습 상황에 놓여져 있고, 온라인 학습 상황에서 교수자나 학습자 간의 실제적 관계를 인식하거나, 온라인의 상호작용 속에서 의미가 실제적으로 구성되고 지식이 습득된다고 인식하는 것에 관한 실재감을 각각 의미한 것이다.

온라인 토론은 비대면의 온라인 학습 환경에서 이루어지므로 학습자의 실재감 인식에 따라 학습자 간의 상호작용과 참여도 수준이 달라질 수 있기 때문에 온라인 토론 참여자의 실재감 수준을 분석하거나 온라인 토론 참여자들의 상호작용 양상에 대한 분석을 통해 인지적, 사회적, 교수 실재감 등의 학습 실재감을 분석하는 연구, 이러한 학습 실재감이 온라인 토론의 참여나 상호작용에 미치는 영향 등에 관한 연구 등이 주로 수행되었음을 확인할 수 있다.

넷째, 토픽4는 ‘온라인 토론 게시판에 나타난 정치 참여 메시지 유형 분석(Analysis of the type of political participation message on the online discussion board)’로 명명하였다. 토픽 4의 주요 키워드는 토론(discussion), 온라인(online), 정치(politics), 참여(participation), 메시지(message), 유형(type), 게시판(board), 분석(analysis), 사용(use), 중심(center), 인터넷(internet), 영향(influence) 등을 포함하고 있다. 현대 사회는 인터넷 미디어의 발달로 인해 미디어를 통한 상호 네트워크 수행을 비롯하여 정치와 관련된 다양한 사회적 이슈에 대하여 온라인 토론 게시판을 바탕으로 지지 행위 혹은 커뮤니티 내의 관계 형성 등을 목적으로 한 정치 참여 행위를 실천하는 양상을 보인다. 이에 온라인 공간은 정치 참여를 위한 공론장의 기능을 수행함에 따라 정치 이슈에 대한 다양한 담론 분석을 위해 온라인 토론 게시판에 대한 분석 연구가 중점적으로 다루어졌음을 확인할 수 있다.

다섯째, 토픽5는 ‘사회적 참여 및 숙의를 위한 온라인 공론장(커뮤니티)에서의 온라인 토론(Online discussion in the online public sphere(community) for social participation and deliberation)’로 명명하였다. 토픽 5의 주요 키워드는 토론(discussion), 온라인(online), 분석(analysis), 대화(conversation), 공론장(public sphere), 커뮤니티(community), 참여(participation), 사회적(social), 의견(opinion), 숙의(deliberation), 합리적(rational), 정보(Information) 등을 포함하고 있다. 토픽 4가 정치적 담론을 형성하는 공론장으로서의 온라인 토론 게시판에 메시지 분석 연구에 관한 것인데 반해, 토픽 5는 정치적 이슈를 포함한 정치, 경제, 사회적 이슈 전반에 대한 사회적 의견 수렴 및 숙의를 위한 온라인 공론장으로서의 커뮤니티 내에서의 온라인 토론에 관한 연구에 관한 것으로 볼 수 있다. 토픽 5도 사회적 이슈에 대해 시민적 참여 행위로서 온라인 공론장에서의 온라인 토론을 통한 사회적 소통의 기능 및 관련 메시지 분석에 관한 연구가 중점적으로 다루어졌음을 확인할 수 있다.

여섯째, 토픽6은 ‘교수 학습 활동으로서의 온라인 토론 수업 모형(대학생, 예비 교사, 일반 청소년 학습자 포함)(Online discussion instruction model as teaching and learning activity(including university students, prospective teachers and general youth learners))’로 명명하였다. 토픽 6의 주요 키워드는 토론(discussion), 수업(class), 온라인(online), 학생(student), 활용(utilization), 교육(education), 인식(cognition), 효과(effect), 대학(university), 예비교사(prospective teacher), 학습자(learner), 교실(classroom) 등을 포함하고 있다. e-learning 기반의 수업 국면에서 주요 교수 학습 활동으로 온라인 토론 수업 모형에 대한 연구가 중점적으로 이루어져 왔다. e-learning 기반 수업에서 일반적으로 적용되는 온라인 토론 학습뿐 아니라 플립드 (Flipped) 러닝과 블렌디드 러닝이 이루어지는 과정 내에서 연계된 학습 활동으로서의 온라인 토론 학습에 관한 연구들이 중점적으로 이루어졌다. 효과적인 온라인 토론 전략 방안, 온라인 토론의 학습 전략, 스마트 환경에서의 온라인 토론 학습 효과, 플립드 러닝이나 블렌디드 러닝 내 온라인 토론 관련 연구 등이 중점 연구로 포함된다.

일곱째, 토픽7은 ‘온라인 토론을 통한 커뮤니티 담론 구조 분석(남성, 청소년 등)(Analysis of community discourse structure through online discussion (male, youth, etc.))’로 명명하였다. 토픽 7의 주요 키워드는 온라인(online), 담론(discourse), 남성(male), 분석(analysis), 활동(activity), 커뮤니티(community), 중심(center), 토론(discussion), 청소년(youth), 구조(structure), 필요(need), 공간(space) 등을 포함하고 있다. 토픽 7은 온라인 커뮤니티 내에서 온라인 토론을 통해 특정 담론 등이 어떻게 구축되는지에 대한 연구가 주로 이루어졌다. 특정한 성별 집단인 남성이나 연령 집단인 청소년 집단의 특정 담론을 분석하기 위해 중점 온라인 커뮤니티 내에서 담론이 형성되는 온라인 토론의 메시지 분석을 통해 특정 집단의 담론 구조를 분석하는 연구가 중점적으로 이루어졌다.

특히, 남초 커뮤니티를 대상으로 미투(MeToo) 운동, 펜스룰, 선량한 남성 약자, 여성 혐오 담론의 구조 분석을 위한 연구들이 최근의 젠더 이슈를 둘러싼 논의를 바탕으로 이루어졌는데 이는 2017년을 기점으로 전 세계적으로 확산된 미투 운동은 2018년 전후로 국내 정치, 문화 예술, 종교, 교육계 전반으로 확산되기 시작하면서 본격적인 젠더 이슈가 국내 부각되기 시작하였다. 이와 관련하여 젠더 담론 분석이 온라인 및 사회적 미디어를 기반으로 이루어지기 시작하였는데 토픽 7은 이와 관련한 연구들이 중점적으로 이루어진 것을 나타낸다.

이상의 7개의 토픽 주제를 다루고 있는 연구 논문의 수로 토픽 비중을 도출한 결과를 살펴보면, ‘교수 학습 활동으로서의 온라인 토론 수업 모형(대학생, 예비 교사, 일반 청소년 학습자 포함)’에 관한 연구가 가장 많이 수행된 연구이며, 다음으로 ‘온라인 토론 학습자의 참여도와 몰입, 만족도 진단 및 영향 요인 분석’, ‘온라인 토론 학습자의 참여 및 상호작용에 영향을 미치는 인지적, 사회적 실재감 효과’, ‘온라인 토론 학습자의 상호작용 양상 분석을 위한 대시보드 및 시각화 분석’의 연구가 주로 수행된 것으로 나타났다.

이를 통해 온라인 토론에 관한 연구들은 비대면 온라인 학습 환경에서 주요 교수법으로 다루어지는 온라인 토론의 효과적인 전략이나 온라인 토론에 참여한 학습자의 특성으로서의 참여도나 몰입 양상을 분석하거나 혹은 이러한 참여 및 상호작용에 유의미한 영향을 미치는 학습 실재감이나 대시보드를 통한 시각화 기반의 피드백 방안 등에 대한 연구가 중점적으로 수행되었음을 확인할 수 있다.

Time Series Analysis

온라인 토론에 관한 연구에서 최근 활발히 수행되는 연구와 그렇지 않은 연구 토픽을 살펴보기 위하여 시계열 분석을 실시하였다. 2011년부터 2020년까지 토픽의 연도별 토픽 추세 분석을 위해 시계열 선형회귀분석을 실시하였고 결과는 Fig. 4와 같다.

http://dam.zipot.com:8080/sites/BDL/images/N0230110303_image/Fig_BDL_11_03_03_F4.png

Fig. 4. Time series analysis by topic

먼저 온라인 수업 환경에서 교수 학습 방법으로서의 온라인 토론에 관련한 연구 주제들을 범주로 하여 개별 토픽의 연도별 시계열 분석 결과를 분석하면 다음과 같다.

토픽1인 ‘온라인 토론 학습자의 참여도와 몰입, 만족도 진단 및 영향 요인 분석’은 2011년과 2013년 가장 높은 비중을 차지한 연구였으나 그 이후로 지속적으로 감소하다가 2018년 이후로 비중이 다시 상승하는 것이 나타났다. 토픽 3인 ‘온라인 토론 학습자의 참여 및 상호작용에 영향을 미치는 (인지적), 사회적 실재감 효과’는 2012년에 가장 높은 비중을 차지하였으나 이후 지속적으로 하강하다가 2020년을 기점으로 다시 높은 비중을 차지하는 것으로 나타났다.

토픽 2인 ‘온라인 토론 학습자의 상호작용 양상 분석을 위한 대시보드 및 시각화 분석’은 2011년 이후로 지속적으로 상승하다가 2017년에 가장 높은 비중을 보였고 이후 2019년에 다시 높은 비중을 차지한 것으로 나타났다. 토픽 6인 ‘교수 학습 활동으로서의 온라인 토론 수업 모형(대학생, 예비 교사)’은 2011년 이후로 지속적으로 상승하다가 2016년 가장 높은 비중을 보였고 그 이후로는 급속한 하강을 보이다 2020년에 들어 다시 비중이 일부 상승하는 양상을 보였다.

이러닝 수업 환경에서 주요 교수 학습 활동으로 다루어지는 온라인 토론에 관한 연구들은 2011년 초반 온라인 토론 학습자의 참여 양상이나 상호작용 양상, 실재감 효과 등이 활발히 진행되다 감소하였고 2020년을 기점으로 다시 상승하는 주제로 나타났고, 온라인 토론 수업 방식에 관한 연구는 2011년 이후 지속적으로 상승하다 2020년 기점으로 높은 비중을 차지하는 것으로 나타났다. 토픽 2의 ‘온라인 토론 학습자의 상호작용 양상 분석을 위한 대시보드 및 시각화 분석’에 관한 연구는 다른 토픽들과 비교할 때 지속적인 증가 양상이 두드러졌는데 이는 학습분석학(learning analytics)의 학문적 발전과 관련된 것으로 보인다. 또한 온라인 토론은 2020년 이후 코로나로 인한 비대면의 온라인 교육 환경 속에서 더욱 부각되는 교수 학습 활동 중 하나이므로 최근 이와 관련한 연구들의 비중이 좀 더 높아짐을 확인할 수 있다.

다음으로 온라인 커뮤니티 환경에서 정치, 사회적 참여 활동이자 사회적 담론 구조를 형성하는 행위로서의 온라인 토론에 관한 개별 토픽의 연도별 시계열 분석 결과를 분석하면 다음과 같다.

토픽 4인 ‘온라인 토론 게시판에 나타난 정치 참여 메시지 유형 분석’은 2012년에 가장 높은 비중을 보이다 다소 하강하였고 다시 2015년 높은 비중을 보인 이후로 2020년까지 하강하는 연구 주제로 나타났다. 다음으로 토픽 5인 ‘사회적 참여 및 숙의를 위한 온라인 공론장(커뮤니티)에서의 온라인 토론’은 2011년 이후 다소 상승하다가 2013년 가장 높은 연구 비중을 보였고, 이후 지속적인 하락 이후 2016년 이후부터 2019년까지 급속한 상승 양상을 보이다 다시 2020년 하락하는 양상을 보였다. 토픽 7인 ‘온라인 토론을 통한 커뮤니티 담론 구조 분석(남성, 청소년 등)’은 2012년 이후 지속적인 감소 양상을 보이다 2016년 이후 지속적으로 증가하는 양상을 보이다 2020년 현재 가장 높은 연구 비중을 보이는 것으로 나타났다.

사회적 참여나 정치적 소통 행위로서의 온라인 토론에 관한 토픽은 2012년과 2013년 사이에 주로 연구되다가 2015년에 조금 상승한 이후 지속적으로 하락 양상을 보이는 것으로 나타났다. 반면에 온라인 토론에 기반한 사회 구성원의 담론 분석에 관한 연구는 최근 10년 사이 지속적으로 상승하는 주요 연구 주제로 나타났다.

실제로 이러한 분석 결과는 Table 3의 분석 결과로도 확인할 수 있다. 일반적으로 회귀계수가 양수(+)이면 연구 비중이 증가 추세에 있는 상승 토픽(hot topic)으로 분석할 수 있고, 음수(-)이면 연구 비중이 감소하는 하강 토픽(cold topic)으로 분석할 수 있다. 이에 따르면, 토픽 4인 ‘온라인 토론 게시판에 나타난 정치 참여 메시지 유형 분석’은 유의수준 .05에서 통계적으로 유의한 하강 토픽으로 나타났다. 반면에 토픽 7인 ‘온라인 토론을 통한 커뮤니티 담론 구조 분석(남성, 청소년 등)'은 유의수준 .05에서 통계적으로 유의한 상승 토픽으로 나타났다. 다만 본 연구에서는 온라인 토론에 관하여 대상이 되는 연구 편수가 약 100개로 7개 토픽 당 해당되는 편수는 10편 내외로 나타나 10년 단위 시계열 분석의 해석과 관련하여 증감에 대한 변화량이 크게 추정되는 문제가 발생한다. 이에 대상 연구물이 축전된 이후에 시계열에 관한 추가적 분석을 실시할 필요가 있다.

Table 3. Results of regression analysis for hot topic and cold topic

http://dam.zipot.com:8080/sites/BDL/images/N0230110303_image/Table_BDL_11_03_03_T3.png

**p<.001, *p<.05

Conclusions

본 연구에서는 LDA 기법을 활용한 토픽모델링과 시계열 선형회귀분석을 적용하여 지난 10년간의 온라인 토론에 관한 연구 동향을 분석해 봄으로써 온라인 토론에 관한 연구 방향을 모색하고자 하였다. 연구 결과를 정리하면 다음과 같다. 첫째, 상위 30개의 빈출 단어 분석 결과 온라인 토론 참여자의 ‘실재감’, ‘만족’, ‘몰입’ 등의 단어가 학습자의 특성과 관련하여 도출되었다. 이는 비대면의 온라인 교수 학습 상황에서 온라인 토론 참여자들의 실제적인 참여도나 상호작용을 촉진하는 방안을 탐색하는 것이 주로 연구되었으며 이를 위한 학습자의 정의적 요인 등이나 주요 영향 요인에 관련한 연구가 중점적으로 이루어졌음을 확인할 수 있다. 둘째, 토픽모델링을 통한 분석에서 7개의 중심 연구 토픽이 추출되었다. 이들 7개의 토픽은 온라인 수업 환경에서 교수 학습 방법으로서의 온라인 토론에 관련한 연구 주제에 해당하는 토픽1, 토픽2, 토픽3, 토픽6이 도출되었다. 또한 온라인 커뮤니티 환경에서 정치, 사회적 참여 활동이자 사회적 담론 구조를 형성하는 행위로서의 온라인 토론에 관련한 연구 주제에 해당하는 토픽4, 토픽5, 토픽7이 도출되었다. 이를 통해 국내 온라인 토론의 연구 주제 범주는 각각 온라인 교수 학습 방법의 측면과 온라인 담론 형성 방법으로서의 온라인 토론의 측면 2가지로 각각 분류될 수 있다. 셋째, 토픽모델링의 결과 중 7개의 토픽별 연구 비중에 관한 분석을 보면 온라인 수업 환경에서 교수 학습 방법의 측면에 관련한 연구가 상대적으로 더 비중있게 다루어져 왔다. 연구의 비중을 분석한 결과에 따르면, 교수학습 방법으로서의 ‘온라인 교수 학습 활동으로서의 온라인 토론 수업 모형(21.28%)’의 연구 비중이 가장 높은 것으로 나타났고, ‘온라인 토론 학습자의 참여도와 몰입, 만족도 진단 및 영향 요인 분석(16.76%)’, ‘온라인 토론 학습자의 참여 및 상호작용에 영향을 미치는 (인지적), 사회적 실재감 효과(15.56%)’, ‘온라인 토론 학습자의 상호작용 양상 분석을 위한 대시보드 및 시각화 분석(15.15%)’의 순으로 나타났다. 넷째, 온라인 담론 형성 방법으로서의 온라인 토론의 측면에서 다루어진 연구의 경우 온라인 수업 환경에서 교수 학습 방법으로서 수행된 연구에 비한 상대적인 비중은 덜한 것으로 나타났다. 비중을 분석한 결과에 따르면, ‘온라인 토론 게시판에 나타난 정치 참여 메시지 유형 분석(12.27%)’에 대한 연구 비중이 가장 높은 것으로 나타났고, ‘사회적 참여 및 숙의를 위한 온라인 공론장(커뮤니티)에서의 온라인 토론(10.65%)’, ‘온라인 토론을 통한 커뮤니티 담론 구조 분석(남성, 청소년 등) (8.30%)’은 그 다음의 순으로 나타났다. 다섯째, 연도별 시계열 분석을 통한 연구 변화 추이를 분석한 결과, 고등교육 기관인 대학이나 성인 대상의 평생 교육, 직업 교육의 맥락에서 이러닝 수업이 확산되고 2012년 전후로 부상하기 시작한 MOOC(Massive Open Online Courses)를 통한 국내 대학의 원격 수업이 전환된 이후로 원격 수업의 교수 학습 활동으로서의 온라인 토론에 관한 학습자 분석, 참여 및 상호작용 양상, 실재감에 관련한 연구 주제가 2011년-2012년 사이에 연구가 중점적으로 이루어지다가 감소하였고 코로나 19 이후 대학과 초중등 교육 분야에서 원격 수업이 본격적으로 도입되기 시작하면서 다시 관련 연구들이 급속히 증가하기 시작하는 양상을 보였다. 흥미로운 바는 학습관리시스템인 LMS(Learning Management System)에서 제공하는 다양한 학습 관련 데이터를 기반으로 한 학습분석학(learning analytics) 연구 분야의 확대로 인해 온라인 토론 학습자의 상호작용 양상 분석을 위한 대시보드 및 시각화 분석 관련 연구는 최근 10년 꾸준히 증가하는 양상을 보였다. 여섯째, 연도별 시계열 분석을 통한 연구 변화 추이를 분석한 결과, 사회적 참여나 정치적 소통 행위로서의 온라인 토론에 관한 토픽은 2012년과 2013년 사이에 주로 연구되다가 2015년 이후 일부 상승한 이후 하락하는 연구 주제로 나타났고 온라인 토론에 기반한 사회 구성원(남성, 청소년 등)의 온라인 커뮤니티에 나타난 담론 분석에 관한 연구는 최근 10년 사이 지속적으로 상승하는 주요 연구 주제로 나타났다. 본 연구의 결과를 바탕으로 한 온라인 토론에 후속 연구의 방향을 제시하면 다음과 같다. 첫째, 온라인 토론에 관한 연구 중 온라인 커뮤니케이션의 온라인 담론 형성에 관한 연구 비중보다 온라인 수업 환경에서 교수 학습 방법의 측면에 대한 연구의 비중이 훨씬 더 압도적으로 수행되었음을 확인할 수 있었다. 전체 연구 중 온라인 커뮤니케이션의 방식이나 담론 형성의 방식으로서 온라인 토론을 다룬 연구는 지난 10년간 온라인 토론에 관한 전체 연구 중 약 15% 수준에서 이루어졌다. 현대의 주요한 커뮤니케이션의 방식임을 고려할 때, 온라인 토론에 관한 담화 특성, 의사소통 관습, 담론 구성의 과정, 전통적인 토론과 온라인 토론의 차이점 등에 관한 범주에서의 연구가 좀 더 폭넓게 수행될 필요가 있다. 둘째, 온라인 토론을 통한 사회적 참여와 숙의, 담론 형성의 과정에 대한 연구에서 내용 분석의 주된 방법은 온라인 토론의 게시글이나 댓글에 대한 연구자의 질적 분석을 바탕으로 한 담론의 주요 단어 선별 및 주제 분류의 방법들을 채택하는 것이었다. 이들 연구 중 Jeong (2020)의 연구와 같이 페어클로(Fairclough)의 비판적 담론 분석(Critical Discourse Analysis)을 접목하는 경우는 아주 제한적으로 나타났다. 교육 분야의 온라인 토론에 관한 연구들에서 사회 연결망 분석(Social Network Analysis)를 접목하여 학습자 구성원들의 온라인 토론에 나타난 지식 구성의 과정을 양과 질적인 측면에서 분석하는 연구(Park&Choi, 2011)의 방식들을 접목하여 담론 분석 연구의 방법론을 보다 더 확대하여 실행할 필요가 있다. 셋째, 2011년 교육과학기술부는 「스마트교육 본격 도입을 위한 실행 계획」을 발표하면서 초중등 차원에서의 온라인 수업 실현에 관한 구체적인 정책을 제안하였으나 온라인 수업에서 시행된 온라인 토론에 관한 초중등 학습자를 대상으로 한 연구는 전체 논문 중 3편이었고, 이 중 정규 교과 수업 중 온라인 토론 수업을 연구 대상으로 포함한 연구는 단 2편에 한하였다(Kim&Choi, 2020; Nam et al., 2017). 이에 온라인 토론에 관한 초중등 학습자 대상 범위를 보다 더 확대한 연구를 실행함으로써 초중등 학습자의 온라인 토론 참여 양상 분석, 참여도나 상호작용의 수준, 학습 실재감 인식 등에 관한 탐색적 연구가 이루어질 필요가 있다. 2011년과 2012년 대학 등의 고등교육 기관의 이러닝 학습의 확산이나 2012년 전후로 부상하기 시작한 MOOC(Massive Open Online Courses)를 통한 국내 대학의 원격 수업이 전환된 이후 대학 수준에서의 온라인 수업 내에서의 온라인 토론에 대한 연구는 활발히 이루어진 것을 고려할 때 초중등 학령기 학습자를 대상으로 한 온라인 토론 교육에 관련한 연구는 거의 이루어지지 않은 바, 학령기 학습자 대상의 온라인 토론에 관련한 연구를 보다 더 실시할 필요가 있을 것으로 보인다. 넷째, 온라인 수업 환경에서 교수 학습 방법으로서의 온라인 토론과 관련해서도 대학 등의 고등 교육 기관에서 일반적으로 실행되는 원격 수업 상황에서의 교수 학습 활동으로서의 온라인 토론 수업 모형이나 블렌디드 환경에서의 수업 설계 중 온라인 토론 학습의 방법에 관한 연구가 거의 일반적으로 수행되었다. 그러나 이는 초중등 학교급에서 현재 실행되는 다양한 원격 수업 내에서의 연계 및 적용에 관한 방식과는 다소 차이를 보이는 지점이라 할 수 있다. 이에 초중등의 원격 수업 현실에 적합하면서 원격 수업이나 혼합 수업의 모형이나 사례를 고려한 온라인 토론 기반의 교수 학습 모형을 재탐색하는 연구 역시 실시할 필요가 있을 것으로 보인다.

Authors Information

Kim, Se-Hwa: Oryong Middle School, Teacher, First Author.

ORCID: https://orcid.org/0000-0001-6577-7820

Choi, Sook-Ki: Korea National University of Education, Professor, Corresponding Author.

ORCID: https://orcid.org/0000-0002-7846-7204

References

1 Baek. Y. M. (2017). Text-Mining Using R. Gyeonggi-do: Hanul Academy.  

2 Blei, D. M. (2012). Probabilistic topic models. Communications of the ACM, 55, 77-84.  

3 Dillon, J. T. (1996). Using Discussion in Classrooms. Kim. J. H. (Translation). Seoul, Korea: Gyoyuggwahagsa  

4 Few, S. (2006). Information Dashboard Design: The Effective Visual Communication of Data. Sebastopol, CA: O'Reilly Media.  

5 Garrison, D. R., Anderson, T.,&Archer, W. (2001). Critical thinking, cognitive presence, and computer conferencing in distance education. American Journal of Distance Education, 15, 7-23.  

6 Hara, N., Bonk, C. J.,&Angeli, C. (2000). Content analysis of online discussion in an applied educational psychology course. Instructional Science, 28, 115-152.  

7 Hobbs, R. (2010). Digital and Media Literacy: A Plan of Action. A White Paper on the Digital and Media Literacy Recommendations of the Knight Commission on the Information Needs of Communities in a Democracy. Aspen Institute. 1 Dupont Circle NW Suite 700, Washington, DC 20036.  

8 Hong, S. Y.,&Choi. J. W. (2017). Research trends of student support in higher education using topic modeling. Journal of Learner-Centered Curriculum and Instruction, 17, 21-48.  

9 Jeong, H. J. (2020). A study on the discourse on youth generation from the viewpoint of college students: Focused on ‘online discussion’. Journal of Speech, Media&Communication Association, 19, 229-273.  

10 Kim, I. H.,&Choi, S. K. (2020). Analysis of online interaction patterns in online debate of high school students through SNA. Brain, Digital,&Learning, 10, 419-430.  

11 Kim, J. W.,&Kim, D. J. (2019). Research trends of social studies using text mining: focused on academic papers after 2000. Theory and Research in Citizenship Education, 51, 35-70.  

12 Kim, S. A., Park, J. H., Lee, H. J.,&Chung, Y. J. (2016). A study on the research trends of multicultural art education using the text mining technique. Multicultural Education Studies, 9, 203-227.  

13 Lee, S. S. (2014). A content analysis of journal articles using the language network analysis methods. Journal of the Korean Society for Information Management, 31, 49-68.  

14 Lee, S. S. (2016). A study on the application of topic modeling for the book report text. Journal of Korean Library and Information Science Society, 47, 1-18.  

15 Nam, H. I., Kang, H. S.,&Noh, T. H. (2017). Features of using smart devices in socioscientific issues debate classes. Journal of the Korean Association for Science Education, 37, 787-797.  

16 Marra, R. M., Moore, J. L.,&Klimczak, A. K. (2004). Content analysis of online discussion forums: A comparative analysis of protocols. Educational Technology Research and Development, 52, 23.  

17 Park, E. S.,&Choi, M. S. (2011). The effect of learners' social network centralities on knowledge construction in online debating learning. The Journal of Educational Information and Media, 17, 353-377.  

18 Yoo, M. N. (2017). Development of visualization principles for online discussion activities based on learning analysis. Journal of Educational Technology, 33, 901-941.