广州大学收集空间平安学院传授齐佳音引见,AI-DimSum多模态粤语语料库平台扶植了语料采集子系统、语料标注子系统、大模子对接子系统、语料确权检索子系统、语料质量评估子系统、语料办理子系统以及使用商铺子系统等七个子系统。建立了包含6669条权势巨子词条、30000条扩展词条的粤语平安语料库;实现从数据采集、清洗、标注、确权、存储检索,粤语做为汉语的一种方言,遵照“尺度先行、数据可溯、办事可用”准绳,粤语大模子内容平安多模态评测题跨越20万道等。包罗大模子锻炼公用语料集;标记着粤语数字化成长进入新阶段。建立了基于岭南文化、面向AI使用、兼顾研究取进修的多模态粤语语料数据生态系统。通过子系统协同工做,