让AI学会讲上海话 这所沪上高校以算力赋能“千学百科”
上海教育电视台 2024-11-29 19:17:11
上海教育电视台 2024-11-29 19:17:11
以人工智能赋能学科发展和人才培养,已经成为高等教育的时代课题。而要攀登数智高峰,离不开算力“底座”。在上海大学,学校打造“自强5000算力平台”面向全校师生们开放服务,以算力支撑“千学百科”的研究需求。目前,已经问世“小沪”上海话大模型等最新成果。
眼前这个酷似白玉兰的虚拟数字人,就是上海大学研发的上海话大模型“小沪”。从日常对话到科普问答,“小沪”都能够流畅对话。
要打造一个方言大模型,语料库的建设最为关键。凭借着长期对上海话的研究积累,团队进行近半年的语料收集和标注,上千小时的语音训练和对比测试。
钱小飞 上海大学文学院中文系讲师
让AI学会讲上海话,只是第一步。未来,团队还准备对大模型进行升级。从主播配音,到语言教学,再到助老服务,“小沪”还将有更多的应用场景。
曾军 上海大学党委常委 宣传部部长 文学院教授
不仅是上海话大模型,面向中小学科创的自强教育大模型也将在本周日发布。而在这些大模型问世的背后,离不开庞大算力的支持。在位于上海大学延长校区的这间智能信息中心,15000+核的CPU计算资源、超过2000张GPU加速卡等共同组成了“自强5000算力平台”,整体算力规模已经跻身国内高校前列。从通用大模型到各种垂类大模型,从科研项目的超算需求到AI课程的工具支撑,这一平台正在面向全校师生提供服务,以算力赋能“千学百科”。
许华虎 上海大学信息化工作办公室主任 计算机学院教授
据悉,目前上海大学“自强5000算力平台”还面向校外开放共享,已经联合上海体育大学发布国内首个体育行业大模型——上体体育大模型等研究成果。