DeepRookie

想到,就去做,无非一朝还是一生

服务器端使用docker部署项目

Docker介绍

https://developer.aliyun.com/article/381989

Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的镜像中,然后发布到任何流行的 Linux 机器上。使用Docker可以让每个应用彼此相互隔离,在同一台机器上同时运行多个容器,他们彼此之间共享同一个操作系统。Docker的优势在于,它可以在更细的粒度上进行资源的管理,比虚拟化技术性能更高,更加节约资源。下面是普通虚拟化技术和Docker的对比。

阅读全文 »

GLIP论文理解

GLIP(Grounded Language-Image Pre-training) 是一个可扩展的(generalizable)目标检测模型(其实准确来说应该表述为短语定位模型,本句在这里将"目标检测"和"短语定位"任务混为一谈)

在文章开头先解释一下GLIP论文中用到的一些"黑话"

generalizable(可泛化):侧重于描述模型在不同任务和数据集上的适应性,强调模型学到的特征能够泛化到新的情境。

scalable(可扩展): 关注系统、算法、数据集的可扩展性,确保算法在面对更大规模、更复杂的情况时性能能够保持或提高。在本论文中用到的描述为" scalable and semantic-rich data",侧重于强调数据集的可扩展性,论文通过自训练生成伪标注的方式提高数据集的可扩展性。

language-aware(语言感知的):模型能够理解和处理自然语言。本论文的模型接收文本描述prompt作为输入,自然是language aware的。

semantic-rich(语义丰富的):用于形容数据集包含了丰富的语义信息(包括对物体、场景或其他视觉元素的深层次、有意义的描述,能够捕捉图像中物体之间的关系等)

阅读全文 »

在绝对的力量面前,技巧不值一提。

CLIP论文理解

方法总结

CLIP使用的方法总结

CLIP (Contrastive Language–Image Pre-training) 使用的方法非常简单,主要分为2个部分:

阅读全文 »

《动手学深度学习2.0》学习笔记(五)

《动手学深度学习2.0》电子书的链接地址为https://zh.d2l.ai/index.html

本文记录了我在学习本书第11章节(优化算法)过程中的理解和收获。

阅读全文 »