全国多模态大语言模型计划研究项目目前仍处于初期阶段,当局已与华社初步接触,希望继续与拥有丰富东南亚文化、遗产和历史内容的组织合作,为这个学习模型进行训练。
资讯通信媒体发展局答复《联合早报》询问时指出:“与这些组织接洽时,我们解释了将新加坡各种语言的语境化数据(contextualised data)纳入模型的价值,这可增强模型理解我们的社会规范、遗产、文化习俗,甚至转换语言(code-switching)的能力。”
资媒局也将咨询国家艺术理事会,了解新加坡文学艺术界对这一研究工作的兴趣。资媒局说,它将继续采用协商方式推展生成式人工智能训练项目。
延伸阅读
多机构联合开发AI大型语言模型 从大量文本数据进行训练
用作家作品训练大语言模型 本地英华文坛反应两极
社交媒体、数码与人工智能咨询公司Digimentors首席执行官兼联合创始人斯尼华申(Sree Sreenivasan)告诉记者,新加坡政府希望使用作家的作品来训练大语言模型,是有趣的发展,也是他以前没见过的。斯尼华申曾任美国纽约市的首席数码官。
斯尼华申说:“事实上,大多数政府只是在宣布规则和规定,而且做得很差。我认为新加坡政府正在做的事令人兴奋,且提供了一个极好的机会,特别是在推广本地语言方面。”