最大CLIP!LAION发布CLIP的扩增定律_焦点热文

时间:2022-12-23 18:24:39 来源:


(资料图片仅供参考)

点蓝色字关注“机器学习算法工程师”

设为星标,干货直达!

近日,LAION等机构在Reproducible scaling laws for contrastive language-image learning发布了CLIP的扩增定律(scaling law),其中最大的CLIP为ViT-H/14,基于LAION-2B数据集训练,可以在ImageNet1K数据集上到78.0%的zero-shot准确度,性能超过OpenAI目前开源的CLIP L/14,和Meta AI的FLIP Huge模型性能相当,但是模型已经开源在https://github.com/LAION-AI/scaling-laws-openclip。

论文的实验采用开源数据集LAION-400M和LAION-2B数据集,训练框架采用开源的OpenCLIP,所以论文的实验是可以复现的。训练在1520 NVIDIA A100 GPUs上进行,采用PyTorch DDP分布式训练策略,采用混合精度(但是fp16会不稳定,所以采用bf16,或者基于TF32的float32),训练的batch size在 86-88K之间。实验的总体结论是:扩增定律也明显适用CLIP,当扩增模型,训练数据和算力时,模型在下游任务上有一致性的提升。但是不同的训练数据集表现出不同的扩增系数:OpenCLIP的模型(基于LAION-2B数据集)在图文检索任务上有较大的扩增系数,而OpenAI CLIP模型(基于私有的WebImageText 400M数据集)在zero-shot分类任务上有较强的扩增系数。这个结论和FLIP的结论比较吻合,这说明训练数据集对CLIP的性能确实有比较大的影响。用论文结论的一句话来说就是:Scaling behavior depends on task type and pre-training dataset。更多内容可见论文:https://arxiv.org/abs/2212.07143

标签:

精彩推送

丰收的田野是最美的画卷(中国农民丰收节特别报道)

  五谷丰登,瓜果飘香,稻菽卷起千层浪。这是希望的田野,这是丰收的中国!  习近平总书记强调,“...

来源:2021.09.23

四川警方通报一辆小车冲撞赶集人群:因操作不当撞向行人

  四川警方通报一辆小车冲撞赶集人群:因操作不当撞向行人 已致1死6伤  2021年9月21日10时30分许,...

来源:2021.09.23

北京环球度假区成中秋热门目的地

  新华社北京9月22日电(记者张漫子)今年中秋哪儿最火?多个旅游平台数据显示,赶在中秋佳节前一天正式...

来源:2021.09.23

重庆印发生态环境保护督察五项制度 建立健全“四位一体”督察体系

  中新网重庆9月22日电 (梁钦卿)重庆市生态环境局22日透露,重庆市近日印发生态环境保护督察五项制度...

来源:2021.09.23

福建疫情首发地仙游县多举措加强社区防控

  (抗击新冠肺炎)福建疫情首发地仙游县多举措加强社区防控  中新网莆田9月22日电 (郑江洛 林春茵)...

来源:2021.09.23

天和核心舱的太空“中秋礼包”有什么?怎么送到?

  9月20日下午,伴随着一阵山呼海啸般的巨响,长征七号遥四运载火箭托举着天舟三号货运飞船成功发射升...

来源:2021.09.23

黑龙江省新增新冠肺炎本土确诊病例5例

  中新网哈尔滨9月22日电 (程岩 记者 史轶夫)黑龙江省卫健委22日发布消息,22日0-12时,黑龙江省新...

来源:2021.09.23

访全国教书育人楷模周义朋:荒漠坚守十余载 一辈子只做好一件事

  中新网南昌9月22日电 题:访全国教书育人楷模周义朋:荒漠坚守十余载 一辈子只做好一件事  作者...

来源:2021.09.23

四川泸州市终止地震一级应急响应 转入恢复重建阶段

  中新网成都9月22日电 (记者 刘忠俊)记者22日从四川省泸州市抗震救灾指挥部获悉,该市抗震救灾指挥...

来源:2021.09.23

新闻快讯

X 关闭

X 关闭

新闻快讯