魔爪文学

手机浏览器扫描二维码访问

第15章 比赛在开始前就已经结束(第1页)

2013年的暑假,距离比赛开始时间还有大约一个月的时间。

“模型的训练过程需要将所有的权重,数据和许多中间过程都放入GPU中进行处理。因而GPU的显存大小格外重要。”孟繁岐叹了口气,“即便是我们购买的旗舰690,也太小了,只有4G大小。”

比起后来被美国禁止卖给华国的A100-80G,690不说其他性能,单显存就少了20倍。孟繁岐如今只能可怜巴巴地每次使用16张图片对模型进行迭代。

“一次十六张,一次循环要接近一百万次才能更新完整个数据集。而想把模型收敛好,上百次循环又是少不了的。”

孟繁岐估算了一下,这个版本出一次结果要接近20天,最后的训练过程确实大概消耗了三周左右以收敛到现在的这个性能。

好在ImAGENET在后来基本成为了每个算法工程师必调参的练手数据集,孟繁岐自己就曾无数次刷榜,自然是轻车熟路,清楚各类参数的大概设置。

这为他至少节省了一两个月的珍贵时间。

即便一次训练需要三周之久,孟繁岐却仍旧赶在比赛开始之前就已经准备好了一版模型。

看着训练出来的模型最终性能达到了预期,孟繁岐心中的一块大石总算落地了。

这几个月来,他唯一担心的一件事情就是多年前的老框架会出一些他意料之外的问题,导致最终的结果不能和理论预期吻合。

一旦这种事情发生,找到问题所在并测试解决的代价就太大了。倘若不能够及时解决,会很大影响到他初期的规划。

眼下的结果大约在4.9%的top-5错误率,这个版本比后世论文中的性能要稍差了一丁点,但好在仍旧强于赛事方给出的人类标准了。

一般来说,比赛前是不会公布比赛所使用的具体数据的。只是ImAGENET比赛比较特殊,一千多万量级的图片,总不可能办一两次比赛就舍弃掉,不再使用。

因而每届比赛所用的数据是变化很小的,只是具体赛道,所竞争的内容和评判的方式常会有所调整。

虽说ImAGENET休赛的时期其实也可以提交结果,孟繁岐现在就可以把这个结果上传上去,夺取第一的位置,但关注度毕竟不可与赛时的激烈竞争同日而语。

与此同时,唐璜也终于开始意识到事情的走向已经远远偏离了他的预料。

“我记得之前查到Ale在这上面的准确率不到85吧,你现在这个已经特么超过95了啊。”唐璜第一次来查看结果的时候完全不敢相信这个事实。

“你确定没搞错?别忽悠兄弟啊。兄弟书读的少,很容易被骗的。”唐璜此刻的心态很复杂,很希望这是真的,但由于事情实在显得太美好,反而很难相信。

“是假的,我骗你的。”孟繁岐翻了个白眼,“我加了特技,里面都是化学的成分。”

“不会吧,我亲眼看这性能一路上收敛上来的。”唐璜又翻了翻模型训练的日志,声音之中带了三分委屈。他刚刚已经在脑补自己抱紧大腿,走上人生巅峰的场景了。

这就是患得患失的可怜人啊,不敢相信,却又害怕是假的。

“虽然我没有测试集的真实答案,但是我从训练集里划了百分之5出来没有使用,作为验证的办法。”孟繁岐对这个数据集的方差可以说是了然于胸,95%的数据用于训练,5%的数据用于测试已经是相当稳妥而保守的比例了。

“也就是说,只要这百分之5的数据和测试集的数据差别不大,你的办法可以比去年的冠军强十个百分点?”唐璜仍旧还处于极度的震撼当中。“就这么简单?我还没出力呢,你们就全趴下了?”

唐璜此时的感觉,就像是夜神月第一次发现原来可以直接指派死神去除掉自己最大的对手L一样。想象中的努力,拼搏和奋斗一样都没有发生,也完全没有必要,惊人的成绩和进展甚至在比赛正式开始之前就已经获得。

“这就是人生。成功与失败很多时候可能与你并无关系,习惯就好。”孟繁岐拍了拍他的肩膀,“这次不习惯也没什么,以后的道路还有很长很长,你会习惯的。”

因为不习惯也没办法,是吧。改变不了体重的人就只能改变审美。

否则会被自己折磨一辈子的。

既然在95%的数据上已经取得了这样的结果,接下来要做的就是把余下的5%也加入进去,继续微调模型几天。

如此一来,得出的最终结果就可以直接在11月份的时候做提交所用了。

在一个性能已经相当不错的模型上继续微调它的性能,就远远用不到21天那么久的时间了。

只需两天左右的时间,新的训练日志便显示,模型的性能已经基本收敛到一个固定值,很少再继续波动。

这样的话,孟繁岐在前往澳大利亚会议现场之前,就只剩下唯一的一件事情要做,那就是补齐手头这些论文的实验数据。

将这些文章

;所缺的最后一块拼图填补上去。

截止此时,孟繁岐已经大约完成了接近7篇之多的文章。除了本次的参赛核心,基于残差思想的新模型drea,以及相关的训练技巧,批归一化,Adam二阶优化器,和mix-up数据增强之外。

孟繁岐还在三个其他方向上准备了开创性的工作,以占坑三个关键的领域。

在参赛的相关内容中,其实只有残差网络算得上是开创性的内容。余下的三者,虽然是各自方向上的佳作,但是难以称得上是某一细分领域的奠基之作。

写论文去详细描述,也只是迫于无奈,因为为了确保drea的性能和训练速度,孟繁岐不得已而使用了一些技巧。

为了确保这样的重要结果业界可以复现,孟繁岐不得不详细描述这些训练技巧,于是便写成论文。但若是有得选择,其实并不急于一时。

而他真正希望抢占先机去布局的,一,是先前与付院长讨论过原理的,生成式对抗网络。这是近些年来最具有前景也最优雅的无标签学习方法,是以后所有生成类技术难以绕开的一个里程碑。

二,是基于新思想的实时检测网络。这会使得在图片上分辨物体并确定位置的速度和准确率大大提高。日后落地最广的图像检测技术,不论是人脸识别,自动驾驶还是工业内检测。这些新技术都不得不提到这次提速的重要意义。

三,则是最简洁好用的分割网络,U。这将会是复杂分割任务的基准线,并且会制霸医疗图像领域。

孟繁岐选出这三类加上残差网络,就涵盖了分类,检测,分割和生成四大领域。占领了图像算法的四大主要赛道。

之所以全选择图像类的技术,也是为了显得合理一些。至于语言类,语音类或者多种模态的融合算法,他则计划可以稍稍放缓些时日提出。

;

请关闭浏览器阅读模式后查看本章节,否则将出现无法翻页或章节内容丢失等现象。

热门小说推荐
救命

救命

最近,邪祟界流行一个恐怖传说追杀人类时,切勿接近穿红T喊救命的男青年,也不要接触此人身边的古怪男艳鬼,否则会遭受巨大精神创伤。自信的妖魔鬼怪们真的吗我不信,我来试试看。后来,邪祟首领捏紧茶杯,语气凝重您究竟想怎样?他对面的红T青年腼腆一笑我想加入你们,可以吗?邪祟首领???无常识怪物攻×脑回路清奇受...

穿成渣攻后我就不火葬场

穿成渣攻后我就不火葬场

从小就带有甩锅属性的江时野在某次喝水被呛死之后绑定了一个系统,要求他在各个崩坏世界中扮演好一个心狠手辣,冷漠无情,但最后还必须洗白成功修复世界主线的渣攻。江时野(天花乱坠之中就听到了两个字洗白)这我熟啊!绝对没问题!于是,狗血豪门篇(已完结)江时野站在楼梯上垂眸看着下方披麻戴孝对自己恨之入骨的主角受,端着冷漠无情的范儿,说出来的话却是,其实是你爹把家产双手奉上哭着喊着要我接受的,所以你恨我这一说实在是目标错了。八十几集之后才看清好色渣爹真面目的主角受啥???(主角受我。。我不信!江时野这不就巧了吗?!我录像了0v0)虐恋娱乐圈软饭男篇咸鱼狗仔×傲娇大明星已完结ABO篇戴着止咬器的Alpha风流攻×戴着信息素隔绝带的omega清冷受已完结灵异篇钓系男大学生攻×温润如玉总裁受已完结书中世界篇斯文雅痞管家攻×无限读档炸毛少爷受已完结电竞篇表面温柔实则腹黑运筹帷幄监管者攻×暴躁毒舌电竞逃生者队长受已完结人鱼篇暴戾星级元帅攻×凶残漂亮人鱼受已完结末世篇小疯子学生大佬攻×正气凛然兵哥哥受已完结番外篇持续掉落中原本想象中的火葬场迟迟没有到来,第一次带宿主的系统一脸懵逼剧情原来是这样的吗?!主角之间的虐恋情深呢?八百集你死我活呢?情深深雨蒙蒙呢?!江时野快穿牌不粘锅,诚挚为您服务。后来,系统为什么那些该恨你入骨的主角受都不恨你?江时野微笑因为我长嘴了。主攻1v1甜文江时野x安安排雷1,感情大于剧情,逻辑一般,私设如山,一切为了感情服务。2,一千个人眼里有一千个哈姆雷特,不喜欢就直接放弃,不要抱着作者后边会好的想法坚持,强扭的瓜不甜,觉得不好看请及时撤退。3,弃文不必告知,好聚好散,球球了,别骂我,真的球球你们了,大家都是可爱的小天使,要peacelove。4,互宠文,感情平等。所以,极端gksk误入,对你我都好5,一切不合理的地方都是因为原剧情狗血奇葩。...

念庭

念庭

隔壁古耽处心积虑CP468956感兴趣就点个收藏吧!谢谢!许念x蔺庭年上,年龄差六岁,没有血缘关系,是甜文。沉默寡言面冷心没那麽冷的僞冰山美人受x有着病态掌控欲和占有欲的弟控大帅批攻许念很早就知道了自己喜欢从小一起长大的哥哥蔺庭,但他知道蔺庭一直以来都只把他当成弟弟。他知道这是不会有结果的暗恋,所以他选择把心意深埋于心底。在蔺庭以结婚为前提和一个女人开始交往後,许念就以想住宿为由搬出了蔺家,为了以後都不回蔺家,他骗蔺庭自己已经和人交往,准备同居。没想到蔺庭听完就把他带回家锁了起来...

于京夜热吻

于京夜热吻

喜欢傅忱舟这件事,沈含惜做了十一年。某天夜里被抵在门板,男人幽幽的嗓音划过耳尖,躲我?嗯?沈妹妹。他独有的松木气息压迫心头,沈含惜抑制不住心跳加速。心跳的这麽快。喜欢我?如果是呢?傅忱舟声音冷冽,充满警告,沈含惜,动感情就没意思了。天之骄子傅忱舟,家世显赫,肆意随性,冷血无情。对沈含惜,他自认为没有感情,在身边便宠,丢了也无所谓。可当江城再无那抹娇俏身影,他才晚晚察觉出什麽京城再见,他有未婚妻,她亦有未婚夫,可那又如何,他傅忱舟看上的人,谁都别想染指。沈含惜傅先生,请自重。...

每日热搜小说推荐