<< 返回首页
网站与实验室介绍
本网站是“语言实验与计算交叉科学实验室”的官方网站。
语言实验与计算交叉科学实验室肇始于 1986 年成立的南开大学中文系语音学实验室(负责人:石锋教授),2019 年以“数字中文创新实验室”获批天津市社会科学实验室(实验室主任:沈立岩教授),2023 年更名为现名(实验室主任:冉启斌教授)。实验室位于南开大学八里台校区文学院范孙楼 5 楼。
“语言实验”大致相当于实验语言学,包括声学实验、生理实验、心理实验等。“语言计算”不等于计算语言学,而是指团队正在进行的使用计算方法的语言研究,包括使用代码进行声学分析,使用特定工具进行语言分析,以及与计算语言学(自然语言处理)、深度学习、人工智能有关的语言研究等。
实验室一直以语音学研究为核心,辅以技术手段深入发掘和分析汉语乃至世界语言的发音规律、变化特点,取得了大量科研成果。近年来,在国家与社会需求的引领下,实验室以语言学为核心,不断拓展研究边界,系统推进语言学与前沿科学的深度融合,创新性地将数据库技术、数理统计分析、计算机科学、环境科学、分子生物学方法多学科工具和语言研究相结合,产出了一系列研究成果。
实验室主持有微信公众号“语言实验与计算”,定期发布开放共享的语言科学研究前言信息、数据库、语料库、资源与资讯等。
团队介绍
研究团队由实验室研究人员冉启斌及其博士后、研究生等组成,于 2024 年获批天津市高校哲学社会科学创新团队(语言智能计算创新团队)。团队成员在美国科学院院刊 PNAS 姊妹刊 Nexus、Humanities and Social Sciences Communications、Scientific Reports、Journal of Phonetics、Journal of Voice、Journal of Language Evolution、《中国语文》、《民族语文》等期刊发表系列研究成果。
团队在长期的研究历程中制作有大量计算图谱、语言文创制品等,并积累了近 10 种大规模或较大规模数据库/语料库等,主要包括:
- 世界大型多语言语音语料集成(含英语、法语、西班牙语、日语、韩语等 10 余种语言,约 3 万小时)
- 中国境内语言核心词汇声学数据库(约 300 个地点)
- 世界典型汉语语音偏误数据库
- 民族地区地方普通话语音语料库
- 汉语方言极限声调清单录音数据库
- ASJP 模式的中国境内语言核心词汇语音转写数据库(中国境内 1108 个地点,大部分已整合进 ASJP 数据库第 21 版)
- 世界 100 种语言正反义词语音数据库
- 61 种语言跨语言基本核心词词义数据库
- 大型当代中文文本语料库汇集(约 2700 亿字)
研究团队长期与国内外前沿研究团队和头部企业保持密切合作。欢迎有志于从事语言实验与计算研究的本科生、研究生加盟,欢迎国内外专家学者的访问、交流与合作。
团队 GitHub 页面:https://github.com/EL-CL。
研究方向
- 语言本体研究
- 元音、辅音、声调、语调等的声学实验、感知实验等
- 语言距离、相似度计算
- 语言分类、演化树构拟
- 大规模语言数据库
- 语言与自然环境关系
- 二语习得研究
- 机器学习与语言研究
- 语音识别相关技术:说话人识别、语种识别(包括方言识别)、学习者语音分类及评分、病理语音分类等
- 语音合成及数字人技术
- 自然语言处理与语言研究
- 濒危语言人工智能保护
- 语言文化数智重建工程
- 数字人文
团队成员
- 冉启斌:博士,教授,博士生导师,南开大学文学院副院长。兼任中国语言学会语音学分会副主任委员,中国民族语言学会实验语言学专业委员会执行主任委员、汉藏语言文化专业委员会副主任委员、语言资源与计算人文专业委员会副主任委员,天津市语言学会会长,《南开语言学刊》主编。主要从事实验语言学、语音计算、语言信息处理、应用人工智能技术的语言研究等,出版专著 7 部,发表学术论文 100 余篇。主持国家社科基金重大项目、一般项目、青年项目、国家社科基金重大项目子课题、教育部后期资助项目、国家语委重点科研项目等 10 余项。学院个人网页:https://wxy.nankai.edu.cn/2019/1106/c18394a245671/page.htm。
- 林珈亦,南开大学文学院博士后研究人员,主要从事汉语方言音韵、语言计算等研究。
- 陆旭,南开大学文学院博士后研究人员,主要从事汉语语法、语言计算等研究。
- 许可,南开大学文学院语言学及应用语言学 2022 级博士生,主要从事语言实验、语言计算等研究。
- 王天恒,南开大学文学院语言学及应用语言学 2022 级博士生,主要从事语言实验、语言计算等研究。
- 黄玮,南开大学文学院语言学及应用语言学 2023 级博士生,主要从事语言实验、语言计算等研究。
- 楚乐菲,南开大学文学院语言学及应用语言学 2025 级博士生,主要从事语言实验、语言计算等研究。
- 苑舒婷,南开大学文学院语言学及应用语言学 2023 级硕士生,主要从事语言实验、语言计算等研究。
- 李孜涵,南开大学文学院语言学及应用语言学 2024 级硕士生,主要从事语言实验、语言计算等研究。
- 俞诗雨,南开大学文学院语言学及应用语言学 2024 级硕士生,主要从事语言实验、语言计算等研究。
- 吕瑞烨,南开大学文学院语言学及应用语言学 2025 级硕士生,主要从事语言实验、语言计算等研究。
- 郑光选,南开大学文学院语言学及应用语言学 2025 级硕士生,主要从事语言实验、语言计算等研究。
留学生:
- 萨沙(Mitkov Aleksandr),俄罗斯人,南开大学文学院语言学及应用语言学 2022 级博士生,主要从事语言计算、计算机科学类研究。
- 夏美汐(Ralaiarimanana Felana Anita),马达加斯加人,南开大学文学院语言学及应用语言学 2022 级博士生,主要从事语言实验、语言计算等研究。
- 穆汉(Muhannad Alkhattabi),沙特阿拉伯人,南开大学文学院语言学及应用语言学 2022 级博士生,主要从事语言实验、语言计算等研究。
- 韩懋楠(Kasie Harford),尼日利亚人,南开大学文学院语言学及应用语言学 2023 级硕士生,主要从事语言实验、语言计算等研究。
- 潘垂杨(Phan Thùy Dương),越南人,南开大学文学院语言学及应用语言学 2025 级硕士生,主要从事语言实验、语言计算等研究。
实验室已毕业博硕士生:
- 梁煜珠,南开大学文学院语言学及应用语言学 2020 级博士生,主要从事语言实验、语言计算等研究。
- 王帅,南开大学文学院语言学及应用语言学 2021 级博士生,主要从事语言实验、语言计算等研究。
- 丁俊,南开大学文学院语言学及应用语言学 2021 级博士生,主要从事语言实验、语言计算等研究。
- 王乙婷,东北师范大学语言学及应用语言学 2021 级博士生,主要从事语言实验、语言计算等研究。
- 韩璐璐,南开大学文学院语言学及应用语言学 2020 级硕士生,主要从事语言实验、语言计算等研究。
- 王鸿宇,南开大学文学院语言学及应用语言学 2020 级硕士生,主要从事语言实验、语言计算等研究。
- 段嘉华,南开大学文学院语言学及应用语言学 2021 级硕士生,主要从事语言实验、语言计算等研究。
- 吴梦锜致,南开大学文学院语言学及应用语言学 2022 级硕士生,主要从事语言实验、语言计算等研究。
友情链接