自去年11月ChatGPT横空出世,一波由AIGC引发的热潮轰轰烈烈地传播开。短短两个月,ChatGPT活跃用户量达到1亿,Stable Diffusion也有1000万的活跃用户;众多互联网科技巨头快速加入AI大模型角逐战,更多的语言交互、AI生成视频、AI作画等应用频频涌现;一系列动作都让AI再次成为“热搜词”,引起广泛地关注与讨论。
华为盘古大模型
AI是一项通用的目的技术,它正从局部应用到千行百业。在我们的生活中,无时无刻不使用AI,例如交通的自动驾驶,制造的工业质检,语音识别等等。2019年《迈向万物智联新世界》研究表明,到2025年,企业对AI的采用率将达到86%。那么如何在企业的生产生活中融入AI呢?
首先,我们来看一下AI应用的开发流程:
a) 确定目的,明确AI应用开发的方向,以确定后续的开发方向和整体架构。
b) 准备数据,即收集当前AI应用分析处理所需要的原始数据。原始数据是为了确保AI能够更好的预测分析更多的数据,从而降低人力的消耗。
c) 训练模型,即将收集的数据,使用一定的算力和算法进行训练,最终得到模型用于之后的预测分析。
d) 评估模型,用于评估训练生成的模型是否准确率达标,如不达标,则需继续训练优化。
e) 部署模型,将评估通过的模型,部署到具体的设备上,进行预测分析。
其中数据、算力、算法即为人工智能的三要素,在AI应用开发过程中起到关键性的作用。
在整个AI应用的开发流程涉及到大量的专业知识,例如整体应用框架的构建,合适算法的选择,应用部署的流程,企业进行AI应用开发则需要克服大量的困难。为了进一步简化AI应用的开发难度,当前华为推出了一站式AI开发平台ModelArts,以下为ModelArts的整体框架:
华为全栈AI能力
ModelArts采用华为自研Ascend、Kunpeng系列芯片,为AI应用开发提供海量算力,并支持业界主流AI开发框架(PyTorch、TensorFlow、MindSpore);同时与之搭配的生态社区AI Gallery,还提供了大量的开源数据集、算法、模型等内容,帮助开发者获取AI应用的开发资源。
前面提到,一个完成的AI应用开发,需要确定目的、准备数据、训练模型、评估模型、部署模型这五步。除开确定目的,ModelArts平台在后四步均能进行优化提升AI应用效率。
准备数据:在ModelArts上可以选择Gallery上海量的数据集进行开发,同时,业界常见的图像分类、目标检测、语音识别等数据集格式均支持,如果是没有标注的数据信息,可以仅标注部分数据,然后调用快速标注完成所有数据的标注;
训练模型:ModelArts上可以选择Gallery上业界常见的算法进行训练,也提供当前主流的LLM大模型进行微调,同时在训练的过程中提供实时的训练日志查看,便于问题排查。
评估模型和部署模型,ModelArts也提供对应的评估方式和在线部署测试功能,方便开发者快速使用。
同时,为了更进一步的降低开发者的开发难度,ModelArts将准备数据、训练模型、评估模型、部署模型组成一条Workflow流水线,开发者只需要和ModelArts对话,提供项目需要的数据集,ModelArts就会自动分析数据集并选择自有的算法进行训练得到最终的模型,并给开发者进行评估。
ModelArts对话工作流
当然,如果你想要开发自己的算法,ModelArts也提供云上Codelabs代码开发环境,能够快速调用云上AI算力和存储空间,实现AI算法快速开发。同时也提供本地IDE + ModelArts插件,远程直接连接云上资源开发,贴近你的使用习惯。
Codelabs运行环境
至今,已经有很多企业使用ModelArts平台,进行各个场景进行AI应用开发。
中科院脑智卓越中心利用 ModelArts 绘制斑马鱼脑图谱,重构准确率和召回率已达95%。如果使用多机并行计算,理论上10万个神经元的总重构时间可以从125人工作1整年缩短至仅需10天,单神经元重构费用下降为原来的1/77。如果将研究对象扩展到小鼠或猕猴等大脑结构更为复杂的生物,降本增效将更加可观。
河南鑫磊集团通过业务系统,将运营数据、焦炭数据、原料煤数据、生产过程设备传感器数据等数据进行整合上传到华为云,并由华为云 AI 对其进行智能计算、分析,得出最优配煤比例。初期焦炭质量预测模型平均准确率达到94%以上,后续伴随数据样本增多,模型准确度将持续提升,每年至少可节省成本约3000万。
拓安信使用ModelArts平台,实现了水表照片的快速标注和训练,完成了水表读数识别算法的开发和优化。节省千万人力成本,实现AI自动抄水表,并自动录入到管理系统中,管理效率提升30%,同时也进一步保障了客户的数据安全。
水表读数识别
由此可见,一站式AI应用开发平台ModelArts,为企业AI应用开发提供全流程帮助,有效的提升了AI应用的开发效率和产出。
时代日新月异,科技高速发展。早在2015年,中国国务院印发《中国制造2025》方针,其中智能制造则是本次方针的核心。为了进一步提升企业AI能力,我们需要不断地学习AI知识,使用合适的AI开发工具,为我们的生产生活带来更大的便利。
今年9月,华为云、鲲鹏、昇腾和终端联合打造的华为开发者空间栈正式上线!空间栈是面向新一代开发者的技术成长与学习阵地,聚焦人工智能、大数据、物联网等行业热门技术或前沿趋势。通过训练营、社区活动等形式,帮助开发者一站式了解更多华为技术与产品,持续构建未来竞争力。
其中,华为云主导的昇腾AI·玩转AIGC实战营正在进行中!本期实战营由华为全栈AI即AI芯片Ascend-910、异构计算框架CANN,以及华为云一站式AI开发平台ModelArts提供技术支持。目前已经有3000+开发者报名学习,并对生成对抗网络——StarGAN、中文文生图大模型——悟空画画、Stable Diffusion等前沿技术展开了分享交流,除了AIGC实战营,还有昇腾AI引力场和鲲鹏HPC训练营等众多趣味训练营等你来体验!搜索华为开发者官网即可进入哦!