非计算机专业如何快速看懂并跑通深度学习代

星瑞涛客 2025-08-08 23:18:04
理工科非计算机专业,没学过深度学习,上次分享经验后投了第一篇交叉论文,花了3个月,分享经验: . 对非计算机专业而言深度学习是工具,你要做的是针对课题情景,选合适代码实现,最好根据情景特点对代码适应性改进,并解释改进原因 . 首先还是要学一下python、pytorch基本知识,重点推荐3小时超快速入门python、小土堆 . ❶确定研究对象 深度学习常见任务比如分类、回归、聚类、降维,看看能不能和领域结合,有没有数据集可以用,也可以找找更先进方法,以前用RNN,你用transformer;以前用GAN,现在用diffusion . ❷寻找解决类似问题的论文,选择应满足: ①来源顶刊 ②开源且有完备requirement和readme,代码规范(可以在github上搜索合适代码,看readme中信息找论文,也可以上paper with code搜索论文匹配开源代码,推荐插件AI Code Finder,可以在谷歌学术上看到那些论文开源) ③读懂,读之前先确认代码能够跑通,而且效果相当,可以直接把github上的库链接复制给MiniMax AI,让他在沙盒环境中帮你自动测试,省去了配环境和测试的时间,适合新手小白 . ❸下载代码、配置基础环境(Anaconda),安装requirement里面需要的库,可以看【轮椅级教程】pytorch环境配置 . ❹针对性改进代码 根据课题特点对baseline改进 ①在你数据集下呈现出某维度上更好效果 ②从故事角度说明白改进目的 方法: ①先开debug逐行读懂代码 ②整体理解网络结构,知道每一层作用,输入输出shape变化 ③固定套路修改,比如模块串并联、A+B+C(ABC论文中取核心模块拼接)注意力机制、特征融合等 ④从课题物理现象找解释,比如遥感数据具有时空特征,引入通道空间注意力机制,取个好名字 如果没什么想法也没经验可以把baseline的代码直接复制给MiniMaxAI, 然后告诉他项目,他会自动分析项目背景,在原有baseline基础上自动修改代码,找到到合适模块缝合拼接,给出完整项目文件和消融实验的结果、报告说明和修改理由,还能生成模型图,做成PPT组会汇报,最近还在尝试他的论文复现和代码功能,代码能力差我也可以开发些小程序 . ❺写完一版快速投出去

0 阅读:11
星瑞涛客

星瑞涛客

感谢大家的关注