【bat365在线平台外文讲坛第五十五期】
题目:论数据挖掘技术在文本分析中的应用
时间:2019年11月19日 13:30-15:00
地点:bat365官网登录 同文楼214
嘉宾:毛文伟(上海大学bat365官网登录教授,博士生导师)
讲座嘉宾介绍
毛文伟,教授,博士生导师。现任上海外国语大学科研处副处长。学术兼职包括:中国日语教学研究会上海分会副会长兼秘书长、日本语误用与日本语教育研究会常务理事、全国高等学校大学日语教学研究会理事等。研究方向为认知语言学、语料库应用研究以及二语习得研究。迄今为止,先后主持国家社科基金项目、教育部人文社科项目、上海市中华学术精品外译项目等各级各类纵向科研项目6项,出版专著4部、译著2部、各类教材20余部,发表核心期刊论文20余篇。
讲座内容介绍
数据挖掘技术能够帮助我们从规模庞大、内容纷繁的文本数据中,准确、高效地提炼出研究者难以通过遍览有效捕捉的隐含信息或趋势。其中,词频统计帮助我们获取分析对象的词汇总量、高频词汇以及词汇构成等信息,并据此对文体特征进行较为准确的判断。词表比对揭示了对象文本的叙事方式、所含关键人物、场所和物品等。词语共现网络使我们能够直观地观察到文本中的高频人物、组织等,并揭示这些热词间的潜在联系,从而快速构建热点事件的基本框架。而通过计算共现强度,我们可以轻松、准确地挖掘出与特定关键词关系密切的共现词,从而有效捕捉与之相关的热点话题和媒体动向。
请各年级、各专业研究生积极参加。也欢迎各界学友!