文学院“珠江人文讲坛”系列报告之二十六成功举办
——沈浩教授畅谈大数据如何助力社会科学研究
5月12日下午,我校文学院主办的“珠江人文讲坛”系列报告之二十六在文学院讲学厅举行,中国十大最具影响力的大数据领域学者之一、中国传媒大学沈浩教授以“大数据助力社会科学研究,发现数据应用之美”为题,进行了充满激情的演讲,阐述了大数据在人文社会科学各领域的广阔引用前景。他现场抓取数据进行可视化分析,给予大家极大的震撼。讲座由华南师范大学客座教授、家庭医生在线总裁郑文艺先生主持,华师师生和慕名而来的大学城其他高校的师生聆听了讲座。
沈浩教授一开场就通过美国CBS新闻台《60 Minutes》节目主持人查理·罗斯对机器人索菲亚的的采访展示了大数据时代的来临。大家看到索菲亚甚至会主动跟人搭讪。沈浩教授解释说,“这显示的是现代数据、科技对语言、声音的理解已经到达了一定的水平。人工智能自我学习的能力大大超过人类。”他接着向大家展示了智能翻译软件的应用。他说,而实现语音翻译转换的正是数据,“通过对神经网络的十个亿的大数据进行分析才发明了翻译系统。”除此之外,语音导航、语音对话、谷歌地图、滴滴打车等都是大数据应用的体现,大数据已经愈来愈深刻地影响着人类的生活,“人工智能的背后就是数据,人类的工作渐渐为机器替代正成为一种趋势。大数据时代真的来了。”
沈浩接着深入浅出地解释了什么是数据。他说:“数据的血脉在于连接,关系就是数据。”由于有了大数据,“人类行为的93%是可预知的。”沈浩教授现场随机通过挖掘软件抓取了推特、微博人物的所发的推文和微博信息进行云端处理,即时展示了处理之后的可视化图像。他说,新闻文本(包括视频)、文学文本以及各种文献资料等等信息都可以通过词云(ywords)进行分析处理。词云是数据可视化的形式之一。制作词云图时,系统对文本数据中出现频率较高的“关键词”,在图上予以视觉上的突出,形成“关键词云层”或“关键词渲染”,同时过滤大量非关键信息,使人一看就可以抓住文本的特征。通过大数据来进行人文社会科学,将带来人文社会科学研究的新境界。
人是社会关系的总和,任何关系都“产生”数据。沈浩指出,数据的最重要本质是挖掘具体个体所产生的社会行为。大数据可以用于分析侦测特定的个人,如侦测恐怖分子本·拉登。但大数据的主要作用是通过对人类在互相关联中产生的社会行为进行分析预测,为社会管理提供依据。
当代社会,数据应用已无处不在,“大数据时代来到了,它将使我们的工作、生活和思维方式改变。”沈浩教授认为,如何从海量的数据中发现知识、寻找隐藏在其中的关系及利用价值,需要人们拥有更好的数据洞察力。而一旦我们拥有了大数据,我们也有拥有了世界,我们要拥抱大数据时代。
“我们传统的观点是站在传播的角度看待问题,沈教授的讲座让我们不再局限于这种角度,而是站在数据的角度去看待问题,这能让我们得出更客观、更科学的观点。”石牌校区新闻与传播专业的一位学生在讲座后分享道。大家纷纷表示,这样的讲座,对于我们了解学术前沿,把握社会趋势,是一个有力的推动。