南宁学院自然语言处理应用工程研究中心

时间:2023-09-05作者: 点击:

一、实验室(研究所)概况

南宁学院自然语言处理应用工程研究中心是一个专注于自然语言处理领域的科研机构。中心通过将自然语言处理技术与实际应用相结合,推动人工智能在语言理解、文本分析和智能对话等领域的发展。中心拥有一支由学院教师和企业工程师组成的团队,致力于研究并不断改进自然语言处理算法和模型,提高其精确度和效率。中心还致力于与各界合作伙伴共同开展项目,并将自然语言处理技术应用于信息抽取、文本生成、问答系统、对话系统、文本挖掘、语音识别和生成和机器翻译等领域,聚焦中国-东盟地区语言处理的技术难点,通过对语言学基础理论研究、智能技术研究、语言处理应用对象研究三大方向,推动相关的科研成果实现技术转化,成果转化,产生社会效益和经济效益,从而实现研究成果的创新与落地。中心还积极参与学术交流和人才培养,致力于推动自然语言处理领域的学术进展和社会发展。依托中心进行科研活动有助于促进人工智能学科的建设和发展;改善学科建设的基础条件,并且能够更好的服务于教育教学;依托中心进行科研活动,将科研成果反哺教学,促进人工智能学科不断发展。

二、主要研究方向:关键科学问题、领域、方向及内容等

研究方向

简介

信息抽取

从给定文本中抽取重要的信息,比如时间、地点、人物、事件、原因、结果、数字、日期、货币、专有名词等等。通俗说来,就是要了解谁在什么时候、什么原因、对谁、做了什么事、有什么结果。

文本生成

机器像人一样使用自然语言进行表达和写作。依据输入的不同,文本生成技术主要包括数据到文本生成和文本到文本生成。数据到文本生成是指将包含键值对的数据转化为自然语言文本;文本到文本生成对输入文本进行转化和处理从而产生新的文本。

问答系统

对一个自然语言表达的问题,由问答系统给出一个精准的答案。需要对自然语言查询语句进行某种程度的语义分析,包括实体链接、关系识别,形成逻辑表达式,然后到知识库中查找可能的候选答案并通过一个排序机制找出最佳的答案。

对话系统

系统通过一系列的对话,与用户进行聊天、回答、完成某一项任务。涉及到用户意图理解、通用聊天引擎、问答引擎、对话管理等技术。此外,为了体现上下文相关,要具备多轮对话的能力。

文本挖掘

包括文本聚类、分类、情感分析以及对挖掘的信息和知识的可视化、交互式的表达界面。目前主流的技术都是基于统计机器学习的。

语音识别和生成

语音识别是将输入计算机的语音符号识别转换成书面语表示。语音生成又称文语转换、语音合成,它是指将书面文本自动转换成对应的语音表征。

机器翻译

把输入的源语言文本通过自动翻译获得另外一种语言的文本。机器翻译从最早的基于规则的 方法到二十年前的基于统计的方法,再到今天的基于神经网络(编码-解码)的方法,逐渐形成了一套比较严谨的方法体系。


三、主要人员简介

唐诗,男,副教授,研究生学历,博士在读,教育技术专业,智能科学与技术教研室主任,南宁市高层次E类人才。主持2016年度广西高校中青年教师基础能力提升项目基于APP技术下的渔业信息化平台,已结题;主持2016年度高等教育教学改革工程立项项目互联网+背景下基于创客教育理念的应用技术大学计算机基础课程群教学模式改革的研究与实践,已结题;出版学术专著2部(独著)《APP平台设计与渔业信息化研究》、《创客空间建设与发展研究》;公开发表论文16篇,其中北大中文核心期刊2篇,EI会议5篇,广西优刊(《广西教育》)1篇,其他省级刊物10篇;软件著作权授权登记1项。核心论文《android平板电脑的电子菜单优化设计》获“南宁市人民政府办公厅授予2017年度南宁市自然科学优秀论文”三等奖;个人荣获第十九、二十届、二十一届广西教育教学信息化大赛二等奖两次。

卢志翔,先后毕业于广西师范大学、广西大学,硕士,副教授、大数据分析师,硕士生导师,数据科学与大数据技术教研室主任。主持2017年广西高校中青年教师基础能力提升项目1项、2015年广西教育厅本科教育教学项目1项,2019年广西教育科学“十三五”规划项目1项、2014年广西高校科研项目1项,主要参与市厅级以上项目10项;公开发表论文15篇,其中北大核心3篇。获得1项实用新型专利授权,2项软件著作权。指导学生参加“互联网+”大学生创新创业大赛获广西赛区银奖两项、铜奖多项,指导学生参加蓝桥杯全国软件技术大赛优秀指导老师奖。

邱素贞,先后毕业于桂林电子科技大学、广西大学,硕士,副教授、高级工程师,数据科学与大数据技术专业负责人。自参加工作以来长期从事教育教学和工程实践工作。主持广西高等教育教学改革项目基于云计算的高职院校网络教学实践研究,广西高校中青年教师科研基础能力提升项目基于深度学习的自闭症儿童治疗机器人研究,南宁学院教育教学软件项目C语言程序设计,南宁学院“课程思政”示范课程建设项目C语言程序设计等项目;参研各级科研教改课题8项;潜心研究和实践计算机技术领域的应用,公开发表论文12篇;曾获第十九届广西高校教育教学信息化大赛三等奖、南宁学院教学设计竞赛理工科组一等奖、南宁学院“金园丁工程”优秀创新创业导师奖以及“蓝桥杯”全国软件和信息技术专业人才大赛全国总决赛“优秀指导老师”、第二届广西大学生人工智能设计大赛“优秀指导老师、”南宁学院“优秀竞赛指导教师”、“优秀教师”、“优秀共产党员”等荣誉称号 ;多次指导学生参加软件和信息技术专业人才、创新创业实践比赛,获校级以上奖项15项,其中获国家铜奖(三等奖)2项,获广西区金奖(一等奖)2项、银奖(二等奖)2项,铜奖(三等奖)4项。

欧必杰,毕业于华中科技大学,高级工程师,智能科学与技术专业企业教师。有着多年从事计算机软件开发的工作经验,在Java企业级开发、大数据等领域有较强的专业技术实力,有着丰富的一线专业技术教学经验。

四、社会服务、学术交流等

研究内容和成果依托各合作单位的技术和团队力量,结合多语种语料库建设与运营实际,开展学术、技术创新和应用实践,聚焦中国-东盟地区语言处理的技术难点,通过对语言学基础理论研究、智能技术研究、语言处理应用对象研究三大方向,相关的科研成果实现技术转化,成果转化,产生社会效益和经济效益。

研究中心对人工智能学科建设方面,依托中心进行科研活动有助于促进人工智能学科的建设和发展;改善学科建设的基础条件,并且能够更好的服务于教育教学;依托中心进行科研活动,将科研成果反哺教学,促进人工智能学科不断发展。中心每年设置各种大学生创新项目,不仅为师生提供了信息服务,还扩大了科研在学生中的影响力,极大鼓舞了他们参加科研活动的信心和积极性,提高学生创新能力。

研究中心努力建设成为开放式的,集数据的收集、数据的存储、数据的表示、检索和数据的挖掘、机器学习、语音识别、自然语言处理于一体的多功能综合性研究中心,依托各合作单位的技术和团队力量,整合多方技术、人才、资金、市场等资源优势,结合多语种语料库建设与运营实际,开展相关学术、技术创新和应用实践。同时,相关的科研成果实现技术转化,成果转化,产生社会效益和经济效益。

五、主要研究成果

中心与广西达译科技有限公司在东盟小语种机器翻译方向,基于神经网络的机器翻译模型和多语种翻译技术,优化机器翻译模型以实现高质量的自动翻译,提升翻译准确度和流畅度方面取得了一些成果。

中心与科大讯飞合作在信息抽取方面,研究并提出了关系抽取算法,可以从文本中提取实体之间的关系,用于构建知识图谱和生成结构化数据,构建学生能力画像和岗位画像,为人才培养学生能力画像的人岗匹配研究提供了技术支持。


关闭

桂ICP备11008250号 版权所有©南宁学院通讯地址:广西南宁市龙亭路8号 邮编:530200
技术支持:南宁学院信息化处