<< 返回首页

网站与实验室介绍

本网站是“语言实验与计算交叉科学实验室”的官方网站。

语言实验与计算交叉科学实验室肇始于 1986 年成立的南开大学中文系语音学实验室(负责人:石锋教授),2019 年以“数字中文创新实验室”获批天津市社会科学实验室(实验室主任:沈立岩教授),2023 年更名为现名(实验室主任:冉启斌教授)。实验室位于南开大学八里台校区文学院范孙楼 5 楼。

“语言实验”大致相当于实验语言学,包括声学实验、生理实验、心理实验等。“语言计算”不等于计算语言学,而是指团队正在进行的使用计算方法的语言研究,包括使用代码进行声学分析,使用特定工具进行语言分析,以及与计算语言学(自然语言处理)、深度学习、人工智能有关的语言研究等。

实验室一直以语音学研究为核心,辅以技术手段深入发掘和分析汉语乃至世界语言的发音规律、变化特点,取得了大量科研成果。近年来,在国家与社会需求的引领下,实验室以语言学为核心,不断拓展研究边界,系统推进语言学与前沿科学的深度融合,创新性地将数据库技术、数理统计分析、计算机科学、环境科学、分子生物学方法多学科工具和语言研究相结合,产出了一系列研究成果。

实验室主持有微信公众号“语言实验与计算”,定期发布开放共享的语言科学研究前言信息、数据库、语料库、资源与资讯等。

团队介绍

研究团队由实验室研究人员冉启斌及其博士后、研究生等组成,于 2024 年获批天津市高校哲学社会科学创新团队(语言智能计算创新团队)。团队成员在美国科学院院刊 PNAS 姊妹刊 NexusHumanities and Social Sciences CommunicationsScientific ReportsJournal of PhoneticsJournal of VoiceJournal of Language Evolution、《中国语文》、《民族语文》等期刊发表系列研究成果。

团队在长期的研究历程中制作有大量计算图谱、语言文创制品等,并积累了近 10 种大规模或较大规模数据库/语料库等,主要包括:

  • 世界大型多语言语音语料集成(含英语、法语、西班牙语、日语、韩语等 10 余种语言,约 3 万小时)
  • 中国境内语言核心词汇声学数据库(约 300 个地点)
  • 世界典型汉语语音偏误数据库
  • 民族地区地方普通话语音语料库
  • 汉语方言极限声调清单录音数据库
  • ASJP 模式的中国境内语言核心词汇语音转写数据库(中国境内 1108 个地点,大部分已整合进 ASJP 数据库第 21 版
  • 世界 100 种语言正反义词语音数据库
  • 61 种语言跨语言基本核心词词义数据库
  • 大型当代中文文本语料库汇集(约 2700 亿字)

研究团队长期与国内外前沿研究团队和头部企业保持密切合作。欢迎有志于从事语言实验与计算研究的本科生、研究生加盟,欢迎国内外专家学者的访问、交流与合作。

团队 GitHub 页面:https://github.com/EL-CL

研究方向

  • 语言本体研究
    • 元音、辅音、声调、语调等的声学实验、感知实验等
    • 语言距离、相似度计算
    • 语言分类、演化树构拟
    • 大规模语言数据库
  • 语言与自然环境关系
  • 二语习得研究
    • 口音汉语研究
    • 学习者语音分类
    • 学习者语音评分
  • 机器学习与语言研究
    • 语音识别相关技术:说话人识别、语种识别(包括方言识别)、学习者语音分类及评分、病理语音分类等
    • 语音合成及数字人技术
  • 自然语言处理与语言研究
    • 名词动词差异
    • 语音合成技术评估
  • 濒危语言人工智能保护
  • 语言文化数智重建工程
  • 数字人文

团队成员

  • 冉启斌:博士,教授,博士生导师,南开大学文学院副院长。兼任中国语言学会语音学分会副主任委员,中国民族语言学会实验语言学专业委员会执行主任委员、汉藏语言文化专业委员会副主任委员、语言资源与计算人文专业委员会副主任委员,天津市语言学会会长,《南开语言学刊》主编。主要从事实验语言学、语音计算、语言信息处理、应用人工智能技术的语言研究等,出版专著 7 部,发表学术论文 100 余篇。主持国家社科基金重大项目、一般项目、青年项目、国家社科基金重大项目子课题、教育部后期资助项目、国家语委重点科研项目等 10 余项。学院个人网页:https://wxy.nankai.edu.cn/2019/1106/c18394a245671/page.htm
  • 林珈亦,南开大学文学院博士后研究人员,主要从事汉语方言音韵、语言计算等研究。
  • 陆旭,南开大学文学院博士后研究人员,主要从事汉语语法、语言计算等研究。
  • 许可,南开大学文学院语言学及应用语言学 2022 级博士生,主要从事语言实验、语言计算等研究。
  • 王天恒,南开大学文学院语言学及应用语言学 2022 级博士生,主要从事语言实验、语言计算等研究。
  • 黄玮,南开大学文学院语言学及应用语言学 2023 级博士生,主要从事语言实验、语言计算等研究。
  • 楚乐菲,南开大学文学院语言学及应用语言学 2025 级博士生,主要从事语言实验、语言计算等研究。
  • 苑舒婷,南开大学文学院语言学及应用语言学 2023 级硕士生,主要从事语言实验、语言计算等研究。
  • 李孜涵,南开大学文学院语言学及应用语言学 2024 级硕士生,主要从事语言实验、语言计算等研究。
  • 俞诗雨,南开大学文学院语言学及应用语言学 2024 级硕士生,主要从事语言实验、语言计算等研究。
  • 吕瑞烨,南开大学文学院语言学及应用语言学 2025 级硕士生,主要从事语言实验、语言计算等研究。
  • 郑光选,南开大学文学院语言学及应用语言学 2025 级硕士生,主要从事语言实验、语言计算等研究。

留学生:

  • 萨沙(Mitkov Aleksandr),俄罗斯人,南开大学文学院语言学及应用语言学 2022 级博士生,主要从事语言计算、计算机科学类研究。
  • 夏美汐(Ralaiarimanana Felana Anita),马达加斯加人,南开大学文学院语言学及应用语言学 2022 级博士生,主要从事语言实验、语言计算等研究。
  • 穆汉(Muhannad Alkhattabi),沙特阿拉伯人,南开大学文学院语言学及应用语言学 2022 级博士生,主要从事语言实验、语言计算等研究。
  • 韩懋楠(Kasie Harford),尼日利亚人,南开大学文学院语言学及应用语言学 2023 级硕士生,主要从事语言实验、语言计算等研究。
  • 潘垂杨(Phan Thùy Dương),越南人,南开大学文学院语言学及应用语言学 2025 级硕士生,主要从事语言实验、语言计算等研究。

实验室已毕业博硕士生:

  • 梁煜珠,南开大学文学院语言学及应用语言学 2020 级博士生,主要从事语言实验、语言计算等研究。
  • 王帅,南开大学文学院语言学及应用语言学 2021 级博士生,主要从事语言实验、语言计算等研究。
  • 丁俊,南开大学文学院语言学及应用语言学 2021 级博士生,主要从事语言实验、语言计算等研究。
  • 王乙婷,东北师范大学语言学及应用语言学 2021 级博士生,主要从事语言实验、语言计算等研究。
  • 韩璐璐,南开大学文学院语言学及应用语言学 2020 级硕士生,主要从事语言实验、语言计算等研究。
  • 王鸿宇,南开大学文学院语言学及应用语言学 2020 级硕士生,主要从事语言实验、语言计算等研究。
  • 段嘉华,南开大学文学院语言学及应用语言学 2021 级硕士生,主要从事语言实验、语言计算等研究。
  • 吴梦锜致,南开大学文学院语言学及应用语言学 2022 级硕士生,主要从事语言实验、语言计算等研究。

友情链接