5月17日,由搜狐主办的2025搜狐科技年度论坛在北京盛大开幕。多位院士、科学家与产业界人士齐聚一堂,激发智慧的深度碰撞,奔赴科技的星辰大海。
本届论坛线上线下结合,开启全天的思想盛宴。在下午的现场环节,清华大学计算机系教授、中国工程院院士郑纬民发表了题为《人工智能大模型的基础设施建设与应用探索》的演讲。
郑纬民院士指出,2025年人工智能发展呈现两大特点:第一个是多模态,大模型能处理文字、图像、视频。第二个是应用于GDP密切相关的行业,中国在推动AI落地方面具有显著优势。
他进一步向大家介绍,人工智能大模型的生命周期主要包括五个环节:数据获取、预处理、模型训练、微调和推理。前三个环节需要大量算力和存储资源,通常由大型科技公司如阿里、华为、DeepSeek等完成。一般单位只需基于已有基础模型进行领域适配的微调和后续的推理应用。
郑纬民院士提出,当前大模型训练主要依赖两类系统:一是英伟达GPU,其硬件性能与生态成熟度领先,但面临禁售、价格高涨和一卡难求的困境;二是国产芯片,全国已有3万余家企业投入研发,硬件性能逐步提升,但核心障碍在于生态兼容性不足。
对此,郑纬民院士建议从两方面突破,一方面构建“类 CUDA”系统,确保降低开发者学习成本,通过习惯迁移重塑生态;另一方面提升国产卡硬件性能至国外同类产品的60%以上(若达 70%~80%更佳),即便起步晚、进程难,只要性能基本达标,配合生态优化,仍可吸引用户。此外,还需集中资源做好一些核心软件。
而后,郑纬民院士还以大模型训练中的容错难题、长上下文推理的内存瓶颈,以及算力资源矛盾等实际问题为例,介绍了一些当前模型训练和推理中面临的挑战。
清华大学计算机系教授、中国工程院院士郑纬民
以下为演讲摘录:
现在人工智能2025年大模型两个特点。第一个特点,多模态。这个大模型能处理文字、图像、视频。第二个,真正把它用起来了,用到了跟GDP直接相关的行业。刚才几位说的时候,中国人最擅长做这件事,把这个东西应用于跟GDP直接相关的行业。
下面跟大家简单说说人工智能的五个大周期,生命周期里面五个环节。
第一,大模型最重要的事情就是模型训练,训练的就是数据,数据拿机器训练。第一件事情,数据获取。从世界各地能拿到数据的地方把数据拿来,拿来到我们的实验室的硬盘。
第二个事情,数据预处理。刚才拿来的数据有重复的、有广告、格式不一样,也就是质量不太高。通过预处理把这个质量提高,这件事情做起来,GPT4要做半年预处理。预处理完以后,数据质量高了。
第三个,模型训练。这个时间也很长,设备也很多。最后训练完以后得到一个基础大模型。
第四个,模型微调。把第三个过程出来的基础大模型,假如用在医院,这个还不行,它还不怎么会看病。主要原因,模型训练的时候,医院的数据太少了。因此,在基础大模型的基础上,把医院的数据再第二次训练,叫微调,出来的就是医院大模型,它能看病了。基础大模型要用到金融,直接用还不行,主要是金融数据训练太少。因此,在基础大模型基础上,把金融的数据第二次训练,我们叫微调,得到一个金融大模型。模型微调,实际上就是在基础大模型基础上,对某一个领域数据第二次训练,得到某一个领域的大模型。
最后一个,模型推理,真正把它用起来了。
这五个环节,第一、第二、第三需要大机器、大存储,一般单位不要做这件事。比如你是医院,医院不要做这件事,前面三件事情不要做。谁能做呢?DeepSeek也在做、阿里也在做、华为也在做,他们会最后出来一个基础大模型,我们在基础大模型的基础上下载一个基础大模型,做医院的模型微调。前面三个,一般单位都不要做,我们只做对医院来说就是模型微调,这是要做的。
第四、第五个推理,每个人都有关系。构建国产自然系统的基础软件非常重要。现在支持大模型训练的有三个系统,第一个是基于英伟达公司的GPU,硬件性能好,生态好,但是问题是人家不卖了,价格贵了好几倍,一卡难求。第二个,国产系统,最近几年全国差不多有3万来家公司生产AI芯片,进展也是不错了,但是什么现状呢,国产的卡不太喜欢用,不是它的硬件质量不好,而是它的生态不好。
这件事情很重要,要改变生态我认为要做两件事。第一个,建一个类CUDA系统,什么叫生态,就是习惯了、喜欢用就叫生态系统。英伟达系统有一个叫CUDA,把CUDA学会了就会编软件了。现在很多年了,很多人都喜欢CUDA,国产的系统如果不是CUDA的,人家就不喜欢,就不喜欢用。因此,我觉得我们要建一个类CUDA,虽然是国产卡的系统,但是编软件的时候跟CUDA一样,这个事情可以做的,没问题的。
第二个,国产卡的硬件系统如果能得到国外同类系统的60%,不是说60%就够了,到70%、80%就更好,但是我们晚,进程也比较困难。只要达到60%,把生态做好了,大家也会喜欢用。现在我们感觉到不好用,不是因为硬件性能不好,而是生态不太好。一个是做类CUDA,还有一个是做10个软件。
除本篇外,搜狐科技还将通过多种方式全方位呈现嘉宾们关于前沿科技发展的洞见和思考。更多精彩内容,请关注2025搜狐科技年度论坛专题报道。
2025搜狐科技年度论坛专题PC端
2025搜狐科技年度论坛专题WAP端
文章来源:顶端新闻
文章链接:https://static.dingxinwen.com/dd-sharepage/detail/index.html?id=10499965#/