10月27日,记者从山东省互联网信息办公室获悉,山东省互联网传媒集团自主研发的“海岱传媒大模型”已正式通过山东省生成式人工智能服务备案。值得注意的是,该模型已于去年12月完成算法备案,此次服务备案的完成,标志着“海岱传媒大模型”成为“算法备案+服务备案”双合规的大模型产品,该模型深度垂直服务于传媒领域,旨在为内容生产注入智慧新动能。

专注传媒,打造垂直领域“专业工匠”
与市面上常见的通用式大模型不同,“海岱传媒大模型”的核心优势在于其精准的行业定位。技术团队介绍,其竞争力并非源自知识面的广度,而在于对传媒业务逻辑与需求的深度理解。模型融合了智谱清言、通义千问等国内优秀开源模型的技术能力,并关键性地利用媒体的专业数据进行了精细化再训练,从而变得更“懂行”。
“它的最大特色在于‘专注’与‘专业’。”该大模型算法项目负责人毕建峰表示,“海岱传媒大模型”深刻理解媒体行业的专业术语和工作流程,并针对新闻采编、内容创作等特定场景进行了深度优化。这不仅确保了生成内容的精准度和实用性,更强调了在媒体环境下的高度可控性与安全性。它被设计为一款能够直接嵌入媒体内容生产全流程的“生产力工具”,从源头提升效率与激发创意。
技术的价值在于应用。基于“海岱传媒大模型”能力,山东省互联网传媒集团打造出“海珑智能采编工具箱”等一系列实用化应用,为编辑记者提供了智能写作、素材推荐、标题优化等高效工具,实现了AI技术与采编业务的深度融合。
数据为基,构筑权威合规内容防线
高质量的训练数据是AI模型可靠性的基石。“海岱传媒大模型”在此方面拥有得天独厚的优势。其核心训练语料来源于山东省互联网传媒集团旗下大众网、海报新闻等自有媒体平台积累的海量且权威内容。这些由专业记者生产、并经严格审核的资讯,确保了模型所学“原料”在专业性、真实性和权威性上的高起点。
为确保数据质量与合规,技术团队在数据采集阶段便实施了严格的敏感词过滤与多轮人工校对机制,并对所有数据源进行了全面的知识产权与个人信息安全评估,从根源上保障了学习原料的干净与合法。同时,该模型通过引入魔搭社区等平台的开源数据,实现了传媒专业深度与通用知识广度的平衡,构建了多元且高质量的训练基础。
未来可期,迈向多模态与全域服务
展望未来,“海岱传媒大模型”的演进蓝图已然绘就。据悉,该模型下一阶段研发将重点聚焦于拓展服务边界与深化应用能力。在服务对象上,模型计划从当前主要服务集团内部采编人员,逐步向更广泛的互联网用户开放。
在技术演进上,模型将致力于从当前的文本生成能力,向支持图片、音频、短视频的创作与理解的多模态形态演进,以全面适应全媒体时代的复杂需求。同时,研发团队将着力推动模型与现有采编发系统进行更深层次的融合,实现内容生产全流程的智能化升级。
此外,“海岱传媒大模型”还规划面向财经、体育等具体垂直领域进行精细化训练,开发其专用模型版本,推动其从一个高效的辅助工具,成长为驱动媒体融合发展的核心智能引擎。
作为集团AI战略的核心载体,“海岱大模型”产品矩阵正加速成型与完善。除了核心的“海岱传媒大模型”完成双备案,矩阵的另一关键成员——专注于社会治理与舆情分析领域的“海岱舆情大模型”已于今年9月顺利完成算法备案,目前正积极推进生成式人工智能服务备案工作。