手机浏览器扫描二维码访问
2013年的暑假,距离比赛开始时间还有大约一个月的时间。
“模型的训练过程需要将所有的权重,数据和许多中间过程都放入GPU中进行处理。因而GPU的显存大小格外重要。”孟繁岐叹了口气,“即便是我们购买的旗舰690,也太小了,只有4G大小。”
比起后来被美国禁止卖给华国的A100-80G,690不说其他性能,单显存就少了20倍。孟繁岐如今只能可怜巴巴地每次使用16张图片对模型进行迭代。
“一次十六张,一次循环要接近一百万次才能更新完整个数据集。而想把模型收敛好,上百次循环又是少不了的。”
孟繁岐估算了一下,这个版本出一次结果要接近20天,最后的训练过程确实大概消耗了三周左右以收敛到现在的这个性能。
好在ImAGENET在后来基本成为了每个算法工程师必调参的练手数据集,孟繁岐自己就曾无数次刷榜,自然是轻车熟路,清楚各类参数的大概设置。
这为他至少节省了一两个月的珍贵时间。
即便一次训练需要三周之久,孟繁岐却仍旧赶在比赛开始之前就已经准备好了一版模型。
看着训练出来的模型最终性能达到了预期,孟繁岐心中的一块大石总算落地了。
这几个月来,他唯一担心的一件事情就是多年前的老框架会出一些他意料之外的问题,导致最终的结果不能和理论预期吻合。
一旦这种事情发生,找到问题所在并测试解决的代价就太大了。倘若不能够及时解决,会很大影响到他初期的规划。
眼下的结果大约在4.9%的top-5错误率,这个版本比后世论文中的性能要稍差了一丁点,但好在仍旧强于赛事方给出的人类标准了。
一般来说,比赛前是不会公布比赛所使用的具体数据的。只是ImAGENET比赛比较特殊,一千多万量级的图片,总不可能办一两次比赛就舍弃掉,不再使用。
因而每届比赛所用的数据是变化很小的,只是具体赛道,所竞争的内容和评判的方式常会有所调整。
虽说ImAGENET休赛的时期其实也可以提交结果,孟繁岐现在就可以把这个结果上传上去,夺取第一的位置,但关注度毕竟不可与赛时的激烈竞争同日而语。
与此同时,唐璜也终于开始意识到事情的走向已经远远偏离了他的预料。
“我记得之前查到Ale在这上面的准确率不到85吧,你现在这个已经特么超过95了啊。”唐璜第一次来查看结果的时候完全不敢相信这个事实。
“你确定没搞错?别忽悠兄弟啊。兄弟书读的少,很容易被骗的。”唐璜此刻的心态很复杂,很希望这是真的,但由于事情实在显得太美好,反而很难相信。
“是假的,我骗你的。”孟繁岐翻了个白眼,“我加了特技,里面都是化学的成分。”
“不会吧,我亲眼看这性能一路上收敛上来的。”唐璜又翻了翻模型训练的日志,声音之中带了三分委屈。他刚刚已经在脑补自己抱紧大腿,走上人生巅峰的场景了。
这就是患得患失的可怜人啊,不敢相信,却又害怕是假的。
“虽然我没有测试集的真实答案,但是我从训练集里划了百分之5出来没有使用,作为验证的办法。”孟繁岐对这个数据集的方差可以说是了然于胸,95%的数据用于训练,5%的数据用于测试已经是相当稳妥而保守的比例了。
“也就是说,只要这百分之5的数据和测试集的数据差别不大,你的办法可以比去年的冠军强十个百分点?”唐璜仍旧还处于极度的震撼当中。“就这么简单?我还没出力呢,你们就全趴下了?”
唐璜此时的感觉,就像是夜神月第一次发现原来可以直接指派死神去除掉自己最大的对手L一样。想象中的努力,拼搏和奋斗一样都没有发生,也完全没有必要,惊人的成绩和进展甚至在比赛正式开始之前就已经获得。
“这就是人生。成功与失败很多时候可能与你并无关系,习惯就好。”孟繁岐拍了拍他的肩膀,“这次不习惯也没什么,以后的道路还有很长很长,你会习惯的。”
因为不习惯也没办法,是吧。改变不了体重的人就只能改变审美。
否则会被自己折磨一辈子的。
既然在95%的数据上已经取得了这样的结果,接下来要做的就是把余下的5%也加入进去,继续微调模型几天。
如此一来,得出的最终结果就可以直接在11月份的时候做提交所用了。
在一个性能已经相当不错的模型上继续微调它的性能,就远远用不到21天那么久的时间了。
只需两天左右的时间,新的训练日志便显示,模型的性能已经基本收敛到一个固定值,很少再继续波动。
这样的话,孟繁岐在前往澳大利亚会议现场之前,就只剩下唯一的一件事情要做,那就是补齐手头这些论文的实验数据。
将这些文章
;所缺的最后一块拼图填补上去。
截止此时,孟繁岐已经大约完成了接近7篇之多的文章。除了本次的参赛核心,基于残差思想的新模型drea,以及相关的训练技巧,批归一化,Adam二阶优化器,和mix-up数据增强之外。
孟繁岐还在三个其他方向上准备了开创性的工作,以占坑三个关键的领域。
在参赛的相关内容中,其实只有残差网络算得上是开创性的内容。余下的三者,虽然是各自方向上的佳作,但是难以称得上是某一细分领域的奠基之作。
写论文去详细描述,也只是迫于无奈,因为为了确保drea的性能和训练速度,孟繁岐不得已而使用了一些技巧。
为了确保这样的重要结果业界可以复现,孟繁岐不得不详细描述这些训练技巧,于是便写成论文。但若是有得选择,其实并不急于一时。
而他真正希望抢占先机去布局的,一,是先前与付院长讨论过原理的,生成式对抗网络。这是近些年来最具有前景也最优雅的无标签学习方法,是以后所有生成类技术难以绕开的一个里程碑。
二,是基于新思想的实时检测网络。这会使得在图片上分辨物体并确定位置的速度和准确率大大提高。日后落地最广的图像检测技术,不论是人脸识别,自动驾驶还是工业内检测。这些新技术都不得不提到这次提速的重要意义。
三,则是最简洁好用的分割网络,U。这将会是复杂分割任务的基准线,并且会制霸医疗图像领域。
孟繁岐选出这三类加上残差网络,就涵盖了分类,检测,分割和生成四大领域。占领了图像算法的四大主要赛道。
之所以全选择图像类的技术,也是为了显得合理一些。至于语言类,语音类或者多种模态的融合算法,他则计划可以稍稍放缓些时日提出。
;
请关闭浏览器阅读模式后查看本章节,否则将出现无法翻页或章节内容丢失等现象。
双男主双洁穿书师徒强强年下美人师尊×心机小狗热烈庆祝2025年1月31日本书第一次出评分啦!66分,希望未来还会涨Oy大学生沈云在观看小说傲世天下时,因不满书中的无脑剧情,而在半夜激情输出,却因熬夜修仙加上过于激动一口气没上来过去了。没想到,却因此穿到了书中,并绑定了穿书系统666。对此沈云表示,一切都是浮云,但是他一定要保护好书中的那个可怜的小反派。你可愿做我的徒弟我愿意顾念安看着眼前的人,伸出手,而这一伸便是永远。顾念安的名字中虽然有一个安字,但却从为有过平安。他以为这辈子也就这样了,直到遇到了沈云。小小的他看着眼前的清冷仙君,只觉得遇到了此生的神明,再也移不开眼睛。沈云以为自己只是收了一个小可怜,每天嘘寒问暖,细心呵护,老父亲心情爆表。没想到等小可怜长大後,却想欺师。沈云扶着腰泪流满面,我那个乖巧软萌的小徒弟跑到哪里去了啊?!没有误会!全员长嘴!...
李轩穿越斗罗大陆,开启全能搞事系统。开局绿胖体验卡,每次体验都能获得绿胖的能力。顶级防御,神级怪力,无限耐力,爆锤百万年魂兽。叮!请选一项。初级搞事加入诺丁...
两个莫得感情的老神仙在人间动感情的故事。神仙日子漫漫长,不搞事情心发慌。北辰元君与财神春花在寒池畔私会偷情,被一群小仙娥逮了个正着。长生天帝下诏,将他二人双双贬下凡间,历劫思过。此时正是大运皇朝天下,太平盛世已过百年,暗潮汹涌,妖孽丛生。汴陵城中长孙家得了一位女公子,出世之时口含一枝金报春,惊得产婆打翻了水盆。长孙老太爷大笔一挥,取名曰长孙春花。长孙春花只有一生,财神春花却有无穷无尽的岁月。这只羡鸳鸯不羡仙的戏码硬要往她身上套,如何套?不要急着站CP,容易站错文内大部分诗词为古人所作,不是作者原创。全文完结后回来补充索引。...
暗恋无疾而终惨遭车祸后,我被迫绑定了男主系统续命,从此发现世界变得更癫了,各类退休男主在线追更,评头论足。路人设定的我叠加无限流兽人校园言情哨向等各种男主设定,从此成为男主们眼中烂泥扶不上墙,咸鱼摆烂的娘炮?我真想给他们一拳,系统绑错人了关我什么事。左边是让我变性的系统,右边是骂我娘炮的男主们,身后是一大批向我推销他们伟大天父和救主的狂信徒,前面是一群离疯狂最近的咒术师,我面无表情踹翻后宫线,从一个战力25的渣变成了徒手掀翻祭坛,并且学会和爸爸告状的无赖。在纯爱党和大义党中,我选择成为大爱战神。只是后期的发展逐渐变得不对味起来。老师,能够解释一下,什么叫做救我救疯了,所以决定把我关起来?1第一人称预警,cp后面已定275。2非纯恋爱bg乙女向,掺杂乱七八糟的怪物冒险风,微克系。3女主并非开局无敌流,主咒回,魔改世界观,HE,意难平复活。...
文案△架空世界!架空世界!架空世界!请勿联系现实!△又名一颗红心交祖国文案星元365年的宇航员唐邯青意外穿越并被绑定了系统。系统您已绑定深情系统,请努力扮演深情人设攻略任务目标。唐邯青看了眼所谓的深情系统剧本,嘲讽道你确定是深情系统?不是渣攻贱受系统?系统??!!!此时,正播放着一条新闻光刻机称为人类工业上的皇冠,但我国目前仍未拥有唐邯青瞥了一眼,说渣系统麻烦一边让让,我要去做更有意义的事。我要造一顶皇冠送给我的祖国。这顶皇冠叫光刻机。受苏丶爽丶高智商快穿世界①破産真少爷—光刻机工程师将光刻机这顶皇冠献给祖国②白月光的替身—考古学家祖国的每一分历史都不容他人偷盗③小可怜—世界第一的足球运动员带领国家队冲向世界第一④受气包—宇宙飞船设计师带领人类走向宇宙阅读提示1,架空世界2,攻前期戏份不多,後期会多起来,每个世界都是同一个攻。内容标签系统快穿爽文时代新风轻松唐邯青沈儋辛其它。一句话简介建设美丽家园立意努力奋斗终有回报...