每日更新

中国人工智能产业创新步伐加快

◎本报记者 杜鹏 随着新年的临近,AI行业的竞争愈演愈烈。今年以来,百度、阿里、DeepSeek密集推出新技术、新产品,聚焦大基础模型,加快向人工智能创新高峰发力。 1月22日,百度发布文信大模型5.0正式版,原生全模态集成建模技术,支持文本、图像、音频、视频等信息的输入输出。 1月26日,阿里巴巴推出旗舰推理模型Qwen3-Max-Thinking,彻底改变推理技术并实现性能提升。此后,DeepSeek宣布并开源了新的DeepSeek-OCR-2模型。业内专家认为,短时间内,中国人工智能“进入两条腿走路的格局”,创新步伐明显加快。大型基础模型的演变设定了人工智能能力的上限应用程序。文信大模型5.0正式版以全模态原生架构引领创新,打造竞争优势。据百度官方介绍,与业内大多数采用“后期融合”的多模态解决方案不同,文信大模型5.0正式版采用统一的自回归架构进行全原生模态建模,并在同一模型框架内对多源的文本、图像、视频、音频等数据进行协同训练,使多模态特征在统一架构下充分融合并协同优化,实现全面理解和生成。统一本土完整礼仪。在此前公布的LMArena全球大模型排行榜中,文心大模型5.0正式版多次位居全国文本榜、视觉理解榜第一名,位列全球前茅。阿里巴巴还继续关注更大的钱文模型。新发布的Qwen3-Max-Thinking推理模型全新采用了新的测试时间扩展机制,可以在相同的上下文中进行更高效的推理计算,获得更智能的推理结果,并且更加经济。此外,阿里巴巴将以应用生态为起点,依托自身流量入口优势,推动千文达模式发展电商、酒旅、支付等独特优势领域,深度融入淘宝、支付宝、飞猪等平台,实现技术与场景的高效协同。业内专家表示,与百度、阿里巴巴依靠强大的生态自有商业系统全面发展不同,DeepSeek借助开源的优势,专注于模型的底层功能,构建开放的生态系统。 DeepSeek通过“模型权重+训练框架+部署工具”的全面开源,“最大化成本效益”。深思的最新的 DeepSeek-OCR-2 采用创新的 DeepEncoder V2 方法。这使得模型能够根据图像的不同部分的含义动态地重新排列图像的不同部分,模拟人类观看场景的逻辑流程,在处理复杂图像时变得更加智能和更有逻辑,展现出独特的创新和独创性。 1月29日,百度也快速发布并开源了DeepSeek-OCR-2的文信Paddle衍生模型OCR-VL-1.5。它是首款配备“形状框定位”技术的OCR(光学字符识别)模型,可以准确识别照片。折叠、折叠或弯曲的不规则手稿。百度相关人士表示,作为少数拥有全栈AI能力的公司之一,百度在软硬件协同和场景落地方面也进行了更加持续的投入,在这一轮“顶尖玩家”的竞争中展现出了强大的韧性。至于底层硬件,百度是AI芯片品牌因自身业务对算力的极度需求而推出。昆仑芯走出了从通用专用内部支持到外部服务的完整路径,验证了场景化芯片的可行性,并于近期启动了独立报价流程,以加速其多领域设计。目前,百度正在运营国内首个自研3万卡昆仑核心集群,可支持同时训练多个千亿参数的大规模模型,使自研算力从“现成”跃升至“可大规模复制”。可靠的底层算力、前沿的云服务、强大的建模能力,带来更加丰富的产品和服务。在问心的基础模型的基础上,百度构建了矩阵模型和专业化模型。矩阵模型针对生产级应用程序和快速部署的常见场景。专门型号的目标是工业应用和垂直场景。例如,文心数字NPC模型已在直播电商等领域大规模应用,创造了新的交互体验和内容形式。 2025年“双11”期间,数字人直播总交易额同比增长91%,直播间数量增长119%,超过10万商户使用。自DeepSeek在2025年春节期间火爆以来,中国AI已成为国际科技领域的热门话题。经过一年多的发展,人工智能技术在我国正进入大规模应用的新阶段,进一步验证其驱动产业变革、产生更广泛社会效益的价值。虽然企业的发展路径各有不同,但背后都是一条清晰可见的路径,提升创新能力,共同推动中国人工智能产业从“从“领先”变为“领先”。
(编辑:王婉莹)

你可能也会喜欢...

发表评论

邮箱地址不会被公开。 必填项已用*标注