摘要:PyCharm在AI项目开发提供了优秀的代码编辑、调试、远程连接和同步能力,在开发者中广受欢迎。

使用PyCharm插件配合ModelArts:

  • 一键帮助用户配置远程ModelArts Notebook,免去用户手工配置
  • 按需使用Notebook资源,启动停止,随心所欲
  • 本地代码提交至ModelArts训练任务,沉浸式AI开发体验

ModelArts是华为云一站式AI开发平台,“一站式”是指AI开发的各个环节,包括数据处理、算法开发、模型训练、模型部署都可以在ModelArts上完成。从技术上看,ModelArts底层支持各种异构计算资源,开发者可以根据需要灵活选择使用,而不需要关心底层的技术。同时,ModelArts支持Tensorflow、PyTorch、MindSpore等主流开源的AI开发框架,也支持开发者使用自研的算法框架,匹配您的使用习惯。

AI模型开发的过程,称之为Modeling,一般包含两个阶段:

  • 开发阶段:准备并配置环境,调试代码,使代码能够开始进行深度学习训练,推荐在ModelArts开发环境中调试。
  • 实验阶段:调整数据集、调整超参等,通过多轮实验,训练出理想的模型,推荐在ModelArts训练中进行实验。

两个过程可以相互转换。如开发阶段代码稳定后,则会进入实验阶段,通过不断尝试调整超参来迭代模型;或在实验阶段,有一个可以优化训练的性能的想法,则会回到开发阶段,重新优化代码

1.1.2 插件登录

安装完插件后,会在IDE菜单栏出现ModelArts,点击后选择Edit Credential,出现如下页面

点击插件的How to get AK/SK,跳转到华为云文档去按照指导获取AK/SK,把AK/SK填入登录框中,点击OK,即可完成登录。

1.2 训练代码和数据准备

在本博客中,通过附件进行下载获取。

获取完代码和数据中,需要把训练数据上传至OBS中,为下一步提交训练作业做好准备。

进入到OBS控制台中,如果没有OBS桶,需要创建一个,如果已有桶,在该桶下新建一个data文件夹,把已下载好的训练数据上传至该OBS文件夹中。

通过拼接获取到data和job文件夹OBS地址分别为:

data:obs://3xdata/data/

job:obs://3xdata/job/

1.3 提交训练作业

通过PyCharm把下载好的训练文件打开,点击插件的Training Job进行训练作业提交

在打开的页面中,选择和填入如下参数:

  • Engine必须选择tensorflow_2.1.0
  • 启动文件和目录必须位于当前打开项目
  • OBS Path为上一步获得地址
  • Specifications可以选择免费规格或者CPU/GPU规格

填写无误后,点击Apply and Run, 等待训练作业运行完成即可看到如下图日志输出

恭喜大家,至此,我们的在ModelArts上进行模型开发的体验就顺利完成了。

2. 更多探索 Learn More

如果拥有PyCharm专业版,还可以体验更多丰富功能,使用Notebook进行开发调试后,再进行训练作业提交,可以参考配置本地IDE(PyCharm ToolKit连接)_AI开发平台ModelArts_开发环境_本地IDE_本地IDE(PyCharm)_华为云

欢迎各位点击此处参与。

点击关注,第一时间了解华为云新鲜技术~