期刊导读

社会学及统计学论文_对青年的计算文本“远读”

2022-05-25
文章目录

一、引言

二、“远读”的概念缘起、内容与方法

(一)“远读”的概念缘起

(二)“远读”的内容

(三)“远读”的方法

    1.机器学习概念简述④

        (1)有监督学习:分类、拟合与预测

        (2)无监督学习:聚类与降维

    2.文本的显式表示

    3.文本的降维隐式表示

三、“远读”的路径

1.编码与分类

2.情感分析

3.降维分析

4.主题抽取

5.分化与极化

6.文化测量

四、“远读”青年的降维认识论

(一)“远读”青年中的降维思想

(二)“远读”青年的认识过程

    1.“远读”有助于把握网络青年的观念内容、理解其线上行动

    2.借助降维技术,“远读”以整体视角鸟瞰网络青年的观念结构

    3.降维“远读”的认识方法提供重建“整体事实”、搭建沟通桥梁的可能

五、讨论与展望

(1)文本数据的代表性。

(2)分析方法的适用性。

(3)数据收集中的伦理。

文章摘要:社会数字化转型过程中,越来越多的青年通过互联网社交媒体发表观点、表达情感、与他人建立社会关系,这使得青年的活动场域与交往形式发生了根本转型,靠传统的青年研究方法难以从宏观视角分析青年群体的行动与观念演化。本文引申数字人文中的“远读”概念,提出对青年的计算文本分析研究范式。本文将文本的信息分为词义、词性、关系和情境,并简要介绍了量化这些信息的分析方法,将这些方法的应用路径分为编码与分类、情感分析、降维分析、主题抽取、分化与极化以及文化测量,它们与青年研究领域还有很大的结合空间。通过“远读”计算中的降维思想,研究者能从整体视角找出大量文本之间的潜在结构,进而获得对青年的“整体事实”的理解。在这一范式的应用中,需要注意文本数据代表性、分析方法适用性以及数据收集的伦理问题,而纳入音视频及图像的“富文本”分析会是将来社会科学研究的发展方向。“远读”与“近读”相结合能够促进我们对青年群体的理解。

文章关键词:

论文作者:梁玉成 马昱堃 

作者单位:中山大学社会学与人类学学院 

论文DOI:10.13583/j.cnki.issn1004-3780.2022.03.002

论文分类号:C913.5;TP391.1

上一篇:社会学及统计学论文_走出质性研究的三个误区—

下一篇:社会科学理论与方法论文_社会科学量化研究范式