访问主要内容
香港

中文大学研发首个错字检测系统将推出市场

香港中文大学外景。
香港中文大学外景。 网络图片

香港中文大学工程学院研发出首个错字及粤语检测系统。系统透过吸收历届文凭试试卷及教材内容,帮助香港学生纠正作文时的常犯的错别字及语病问题,尤其对香港文凭试中被称为“死亡之卷”的中文科,可帮助学生对症下药。研发团队预料系统可于年内推出市场。

广告

中文大学研究团队事实上是透过吸收历届文凭试试卷及教材内容,研发出这个“错字和粤语检测系统”,是专为香港学生量身订做的自动中文检测系统,已在部分学校和补习社测试,指检测错别字准确度达八成,将逐步开放予全港中小学使用,并将在本年内转化为(微软办公室)MS Office插件,开放予公众使用。

研究团队认为,随着社交网络及即时通讯软件兴起,年轻人惯以口语、缩写,甚至中英夹杂的文字与人沟通,影响书面语表达能力。团队透过教育局收集数千份高中生作文卷,以及中文教师的批改,加上收集课本、辞典等材料共过百万字,供系统“学习”,研发“错字和粤语检测系统”,冀改善中小学生的中文水平。

团队将系统应用于中小学生中文作文,用电脑输入文章,数秒便可完成分析数百至1000字的文章,平均约10个错字能找到8个。系统还会为每一个错别字和粤语口语提供修正建议。带领研究团队的中大系统工程与工程管理学系教授黄锦辉表示,粤语是精密的语文系统,有独特的语法规则,以及大量口语词汇,增加了检测的难度,希望系统能推进中、小学生的中文学习。

系统会将问题分成“错别字”、“粤语用法”、“简体字”和“倒装用法”四大类别,团队指粤语某些词是倒置使用的,例如书面语的“要紧”会说成“紧要”,若学生输入“紧要”,便会显示为“倒装用法”,团队说明白它们并非错字,而是粤语独有用法,会将它们找出,让用户决定下一次如何做。另外,简体字和繁体字有一字对照多字的问题,例如“后”字用在“王后”一词中是正确的,但如果用在“前后”,系统则会标示为简体字。

系研究员冯沛璋表示,语言与文字会随着时间及地域而不断发展和演变,难以制定一套永久通用并放诸四海皆准的用法,故此为系统加入人工智能和学习元素,能根据使用者选词造句要求,以及语文教师的设定,不断自我改进和更新相关的词语和语法规则,进一步完善其中文检测功能。

电邮新闻头条新闻就在您的每日新闻信里

下载法广应用程序跟踪国际时事

Download_on_the_App_Store_Badge_CNSC_RGB_blk_092917
页面未找到

您尝试访问的内容不存在或不再可用。