2023.2

2023年2月14日

10:23

2023.2.14

继续读《Multi-View Transformer for 3D Visual Grounding》,读到了related work读了三分之一;

做好了集群的分用户以及部分配置;

开篇了一个文章,持续更新

我和我的4个GPU女友之间的那些事儿(持续更新中)

准备重新升级一下显卡驱动和cuda,结果黑屏了,集群出大问题。解决了半晚上,OK了,也记到了博客里面,并且掌握了一种新的安装驱动的方式。

2023.2.15

开了小组会,听了两篇文章,李东东老师的车路协同的文,里面有一个很好的idea,就是假设正常情况下在几毫秒内车辆和人类的移动速度不发生改变,因此可以使用车收到的这一帧的速度矢量乘以车路延迟从而预测真实帧的情况;万老师讲的论文里有一个center perposal很有意思,第一次见。

暂时找到一个我直觉上很对的方向——3D visual grounding,我突然,嗷的一下,就想干活了!!

现在这个领域给我的感觉就是,刚开始火,21年做的人稍微多了一些,去年做的人基本又翻了一倍,刚开始火但还没有爆火的一个程度,感觉可以做的东西很多;另外,3D Visual Grounding做的就更少了,去年只发了10篇文章,前年也是,在早一些,19年开始出现的这个任务,但是19/20年只有一篇文章,因此感觉是个相对冷门,刚刚起步的任务,这个时候这个领域还非常清凉,即基本没有什么灌水的感觉;难度上,也很特别。把经典的任务从2D 向3D迁移是趋势,但是视觉定位这个任务相对其他视觉任务比如目标检测、语义分割这些来说,很特别。正常情况下,一个任务的groundtruth只有一个,CV里的visual grounding也是这样,但是迁移到3D会出现视角问题,视角一换,即便你输入的模态仍然是场景和文本,那场景的grounding truth可能也要一起换,因此,难度上我觉得是一个很有挑战性的东西,里面可以挖掘的新问题也远远比2D多。

最重要的,我很喜欢这个任务。

继续读《Multi-View Transformer for 3D Visual Grounding》,读完了Method,明天开始实验部分。但是Method最后一个子章节我没看懂,如何强化的物体编码器?没理解,读完全文再说,先不求甚解着。

2023.2.16

继续读《Multi-View Transformer for 3D Visual Grounding》,卡在了昨天那个问题上,没有搞明白。

总结了一下这个方向以及我目前认知中的机遇和挑战(形成文本),我觉得可以定方向了。

中午和兵哥哥出去吃了一顿酱骨,难受,太腻了,不学了,今天早退。

2023.2.17

继续读《Multi-View Transformer for 3D Visual Grounding》,读完了,并写了一篇blog,精读这篇工作。没我想的那么牛逼,我以为是牛逼到离谱的那种牛逼,但是这个领域还太雏形,因此其实解决的问题不难,但是很巧妙,很新颖,值得组会讲一讲,有空做一下这个工作的PPT。

今天将RTX3060的主机拿到了,并且装了起来,已经用起来了,装了局域网下共享鼠标和键盘的服务,给新主机装了一些软件,重新打理了整个桌面,现在长这个样子:

明天的任务:找一堆与这篇文章相关的文章,看李沐讲解Bert和其他语言模型。

2023.3.18

今天搞了一上午的键盘和电脑的适配问题,最后没有解决,但是通过笔记本的中转给规避了,详情见我写的这篇博客:https://www.cnblogs.com/loveandninenine/p/17132413.html

随后在PC上安装了anaconda和Pycharm,还没开始使用。

同一个局域网下的无界鼠标属实有点蛋疼,我打算把宿舍那个没用的路由器拿过来路由一下,以后只用网线。

驾校报名+体检通过。

下大雪,回宿舍,喝啤酒,说唱新世代,海龟汤。

2023.3.19

摆烂喝大酒看《说唱新世代》打游戏。

2023.3.20

听组会,龙哥讲解一篇用红外相机和彩色相机做的一个多模态的行人重识别工作,讲道理,没听懂;泽哥讲的是一篇idea文,即车路协同的时候,如果是前融合,那融合的就是点云,那发送点云怎么发?发多少?这篇文章第一次提出点云分区,优先发送重要的数据,并在分区之后对点云进行了压缩,挺有意思的。周三组会顺延,去听动捕设备教学,我要让蒂法跳迈克尔杰克逊!!

下载了一堆Visual Grounding的顶会顶刊论文,以及部分MVT引用的论文,实际上能找到的关于3d Visual Grounding的文章实在是太少了,可以说在我能力范围内找得到的文章基本都找到了,明天后天看看Introduction,分分类,慢慢读。

制作MVT组会PPT,但是没做完,还差实验部分没写。

GPU服务器的netlogin出问题了,修复过程记载在了《我和我的四个GPU女友之间那些事儿》。

明天打算做完MVT的PPT之后,看一下李沐老师讲bert,再看一个bert之前的比较优秀的NLP模型,毕竟Visual Grounding是一个CV+3d+NLP的工作,跨领域的东西我觉得挑战性都挺强的,而我个人又基本没有接触过NLP,因此需要好好看看。

20230221

GPU服务器欢迎界面编辑设置,更新了《我和我的四个GPU女友之间的那些事儿》。

MVT组会PPT制作完成,备注写了演讲稿,这篇可以讲了,基本完全搞懂了。

大概整理了一些VG相关的paper,看了看简介,但是还有一些没看,有点疲惫了,明天再定下来整个阅读顺序,开始慢慢啃paper啦。

下载了最终幻想7重制版,咳咳咳,用来测试一下实验室这块显卡。

明天上午要早起,组织动作捕捉设备的讲座和教学,估计得七点钟起来了……下午和晚上要打印上学期的一些收尾工作(结课论文之类的)交给各科老师;将下载的VG论文全部整理好排序好;学学Bert(这个昨天好像就说要学,但是时间都给了GPU服务器)。

20230222

动作捕获设备的拆装花了得有……6小时。

动捕设备软件的熟悉和使用,建立骨架,数据导出等一系列流程的熟悉。

发了一个视频:《动作捕坤系统》,铁山靠!!!

太累了今天被这折腾的快死了,不学了,睡觉。

20230223

帮师姐的大论文写了两版数据处理代码,困死了困死了。

将之前下载的论文简要整理了一下,排了一下顺序,主要是我想先读两个开山之作,与此同时学一些简单的语言模型,因为有些东西还是要了解的。另外,我发现Visual Grounding经常与DC任务绑在一起,这个也要研究一下。

学习李沐论文精读

参数服务器(Parameter Server)逐段精读

来自 <https://www.bilibili.com/video/BV1YA4y197G8/?spm_id_from=333.999.0.0&vd_source=920f8a63e92d345556c1e229d6ce363f>

学习李沐论文精读:Bert

https://www.bilibili.com/video/BV1PL411M7eQ/?spm_id_from=333.999.0.0&vd_source=920f8a63e92d345556c1e229d6ce363f

20230224

帮老师折腾办公室折腾了一下午,期间,集群竟然又出了一次问题,相关解决方案写在了GPU女友文档里面。

从实验室偷了一台交换机,我一个人用嘿嘿嘿。自己第一次做网线,做了两根,多谢红姐姐的帮助让我一个色弱的人能够排明白线,从而使得无界鼠标变得非常丝滑~~~

《ScanRefer》论文精读,读完了数据集的构建,明天要读Method,

202302025 - 27

三日甲流,高烧不退,咽嗓疼痛,身体虚弱,没有学习。

考虑到马上就到我讲组会,打算先讲MVT,提一嘴这两个开山之作吧,特别是ScanRefer,方法过于naive。

20230228

今天是这个月最后一天了,要将本日报上传到博客园。

重新整理MVT那篇paper,打算作为下次组会的一次讲解,加入了一些VG的history。

继续读Scanrefer,读了一点点,刚不发烧,身体太虚了,不学了,回去了。

ZIAO日报 202302的更多相关文章

  1. 微信小程序开发日记——高仿知乎日报(下)

    本人对知乎日报是情有独钟,看我的博客和github就知道了,写了几个不同技术类型的知乎日报APP 要做微信小程序首先要对html,css,js有一定的基础,还有对微信小程序的API也要非常熟悉 我将该 ...

  2. 微信小程序开发日记——高仿知乎日报(中)

    本人对知乎日报是情有独钟,看我的博客和github就知道了,写了几个不同技术类型的知乎日报APP要做微信小程序首先要对html,css,js有一定的基础,还有对微信小程序的API也要非常熟悉 我将该教 ...

  3. 微信小程序开发日记——高仿知乎日报(上)

    本人对知乎日报是情有独钟,看我的博客和github就知道了,写了几个不同技术类型的知乎日报APP 要做微信小程序首先要对html,css,js有一定的基础,还有对微信小程序的API也要非常熟悉 我将该 ...

  4. 【开源】知乎日报UWP 更新

    说明 大概十天之前我更新了一次APP,后来又仔细看了一下Store里的评论,发现还有几个地方没有改过来.于是前天晚上抽时间改了一下,顺便完善了一下UI体验. 没有看前面文章的童鞋可以看一下下面的链接: ...

  5. 【完全开源】知乎日报UWP版:增加Live磁贴、Badge、以及Toast通知

    目录 说明 实现方法 APP生命期 后台任务 说明 之前网上有人建议增加磁贴(tile).徽章(badge)功能.利用周末的时间,将这两个功能添加上去了.如果将磁贴固定到开始屏幕,磁贴就会循环播放首页 ...

  6. 【完全开源】知乎日报UWP版:项目结构说明、关键源代码解释

    目录 说明 项目结构 关键代码 演示视频 说明 上一篇博客将源码放出来了,但是并没有做过多的介绍,所以如果自己硬看可能需要花费很长的时间,尤其这些代码并不是自己写的.项目不算复杂但是也不算简单,这篇文 ...

  7. 【完全开源】知乎日报UWP版(下篇):商店APP、github源码、功能说明。Windows APP 良心出品。

    目录 说明 功能 截图+视频 关于源码和声明 说明 陆陆续续大概花了一个月的时间,APP算是基本完成了.12月份一直在外出差,在出差期间进行了两次功能完善,然后断断续续修补了一些bug,到目前为止,我 ...

  8. 【完全开源】知乎日报UWP版(上篇):界面设计、官方API分析

    目录 说明 使用Fiddler分析android版API 部分效果图 关于源码 说明 在做博客园UWP版的时候其实就有做知乎日报的打算了,前段时间一直出差,在酒店里用Fiddler简单的分析了一下An ...

  9. 微信小程序之知乎日报

    上一次的<微信小程序之小豆瓣图书>制作了一个图书的查询功能,只是简单地应用到了网络请求,其他大多数小程序应有的知识.而本次的示例是知乎日报,功能点比较多,页面也比上次复杂了许多.在我编写这 ...

  10. 罗永浩专访全文记录(转自好奇心日报-http://www.qdaily.com/)

    这篇文章是转的,存档做记录,定期看一看,激励自己遇到到困难时,想想人家比自己难多了,自己那点事算个屁啊.学习别人,不要带有傻逼主观倾向性,这样什么也得不到,我看完后,发现有一句话,说的非常好,自己有自 ...

随机推荐

  1. 分布式配置nacos搭建踩坑指南(下)

    上一篇介绍了在配置nacos中的碰到的坑,这一篇介绍一下如何正确进行nacos的环境搭建和配置,所以本文分为两部分,第一部分为环境搭建,介绍如何安装和运行.第二部分为alibaba Sprint Bo ...

  2. 【爬虫+数据清洗+可视化分析】舆情分析哔哩哔哩"狂飙"的评论

    目录 一.背景介绍 二.爬虫代码 2.1 展示爬取结果 2.2 爬虫代码讲解 三.可视化代码 3.1 读取数据 3.2 数据清洗 3.3 可视化 3.3.1 IP属地分析-柱形图 3.3.2 评论时间 ...

  3. ASP.NET Core开发者指南(2022版路线图)

    ASP.NET Core开发者指南 2022年 ASP.NET Core 开发者指南: 在下面,您可以看到一个图,说明可以采用的路径以及要成为ASP.NET Core开发人员所想要学习的库.我将此图作 ...

  4. 1 .NET Core笔试题

    1.说说显示实现接口和隐式实现接口的区别. 2.说说file访问修饰的作用. 3.说说什么是原始字符串. 4.C#10 中struct有什么改进? 5.说说C#10中Lambda表达式的新特点. 6. ...

  5. 【Go并发编程】Goroutine的基本使用

    goroutine是什么 goroutine即协程,使用go关键字开启一个协程异步执行代码. 注意,main函数也是个goroutine. 基本使用 使用go执行子任务,会交替执行(和时间片一样). ...

  6. 都在用 AI 生成美少女,而我却。。。

    最近 AI 画画特别的火,你能从网上看到非常多好看的图片,于是我就开始了我的安装之旅,我看到的图是这样的. 这样的. 还有这样的. 然后我就开始了我的 AI 安装生成计划. 安装环境 首先我们需要安装 ...

  7. nvm作用、下载、使用、常见问题

    一.nvm是什么及作用 nvm全名node.js version management,同等于nodejs的版本管理工具.当不同项目使用不同版本nodejs且不统一时,这时就用到nvm进行不同项目不同 ...

  8. elasticsearch 索引数据手动复制注意事项

    一.背景 有一个已经在A机器建立的100+G的es索引数据文件,需要将这份数据文件直接复制到B机器的elasticsearch中 B机器的节点是在一个集群中,有多个数据节点. 没有原始数据,不重新构建 ...

  9. 数据库原理-SQL查询语句

    参考书籍<Oracle 数据库开发与应用> SQL查询语句,针对数据库中的表提供了各种查询功能.这里分为五个部分,说明在SQL中如何对数据进行查询. 简单查询 SELCET语句是最简单的S ...

  10. 面向对象程序设计第二次blog

    一.前言 第四次题目集总结-- 题量:较多 难度:较高 知识点: 获取输入字符串的特定字符类型 获取并储存.计算 循环.选择.字符串.数组的使用 继承 类的设计 总结:题目比较难,题量较少,需要用到正 ...