联系我们 微博
入会流程 潮青商会简介 章程 组织架构 下载申请表 我的建议 在线入会
您现在所在的位置:首页 > 成员新闻

从AI模型最新动态看未来发展丨深圳潮青谢一锋出席杭州DeepSeek双“高峰”论坛有感

新闻来源:深圳潮青商会宣传部 发布时间:2025年03月09日 我要分享




2025年3月5日,在高秉强教授的带领下,深圳市潮汕青年商会副会长谢一锋参加了杭州DeepSeek双“高峰”论坛。此次论坛让他对AI模型发展的最新进展有了更深入的见解,以下他将围绕技术突破、开源生态、应用落地与未来趋势四个维度向潮青们分享自己的感想。





 谢一锋(右一)与参加杭州DeepSeek双“高峰”论坛嘉宾留影 


他表示,过去几个月,我们共同见证了中国AI领域的爆发式增长,而DeepSeek无疑是这一进程中的最大功臣。从大模型的能力突破到开源生态的蓬勃发展,从技术架构的迭代升级到应用场景的全面开花,这场技术革命正在深刻改变我们的生活方式与产业格局。



技术突破:模型架构与计算效率


在技术层面,模型架构的选择是焦点话题。随着参数量的不断增长,计算量成为制约模型发展的重要因素。目前,若Scaling Law持续有效且硬件按现有速度发展,MoE(Mixture of Experts)架构因其可并行计算、能处理大规模数据的优势,被认为是未来的大趋势;而Dense模型在现有计算模式下,计算量增长过快,限制了参数的进一步增加。不过,我们也不能忽视Transformer架构及自回归机制的局限性,未来底层架构可能会借鉴生物脑的工作方式,发生颠覆性变革。训练精度与硬件适配也是技术发展的关键环节。模型训练多采用混合精度策略,依据任务重要性选择8位或16位精度。国产GPU在适配时面临挑战,量化到INT8会有精度损失,升级到BF16或FP16则会使模型大小和算力消耗翻倍。因此,未来模型推理支持至少FP8精度成为重要发展方向,这既能保证一定精度,又能降低计算成本,提高效率。


开源生态:MIT协议的开放与挑战


开源策略在AI模型发展中扮演着重要角色。以DeepSeek采用的MIT协议开源为例,其目的是鼓励更多人基于现有模型进行蒸馏和商业应用开发,构建活跃的生态系统。与其他开源协议相比,MIT协议更加开放、自由,减少了对开发者的限制,有助于激发创新。然而,开源模型也面临一些问题,比如大模型在推理过程中缺乏记忆力,外挂知识库的关键字检索方式受上下文限制,难以满足长期记忆和新知识学习的需求。


应用落地:AI的商业化与潜力


在应用落地方面,当前AI模型在商业应用中存在一些阻碍,如服务器负载过载时API不稳定,影响商业应用的稳定性。但从积极的方面来看,AI在多个领域展现出巨大潜力。在医疗领域,虽存在“幻觉”问题,但对于有明确病案和诊断指南的病症,能提供可靠的辅助诊断;在教育领域,可赋能多种应用场景,提升教育的智能化水平。此外,随着智能硬件与软件的融合发展,未来对服务质量的要求将越来越高,AI在提升服务智能化方面大有可为。


未来趋势:机遇与挑战并存


展望未来,AI模型的发展充满机遇与挑战。一方面,模型能力的提升将推动应用的不断拓展和深化,为各个行业带来创新和变革;另一方面,模型训练的复杂性和不确定性增加,如当前下一代模型训练遇到诸多困难,推出时间难以预测。同时,AI的发展也带来了安全风险,如虚假信息传播、模型被滥用等问题,需要加强监管和规范。


总  结


AI模型的发展是一个复杂而多元的过程,需要技术创新、开源协作、应用探索以及合理监管的共同推动。deepseek团队以技术理想主义驱动商业实践的格局,已然为中国AI发展树立新标杆。当我们回望2025年春天的这场思想碰撞,必将是载入中国人工智能发展史册的重要坐标。我们也共同期待AI为人们带来更美好的未来!


不感兴趣:0 爱看:0 +1
相关新闻阅读
网站版权信息:Copyright(C) 2025 深圳市潮青传媒有限公司
深圳市潮青传媒有限公司 版权所有 粤ICP备13064390号
人才招聘 联系我们 | 邮箱:szchaoqing@126.com
商会公众平台 商会微博
关闭