Multimodal Task
总结下多模态学习的相关任务和相关知识点,梳理下整体脉络。
Phrase Mining
最近打算整理下以前关于phrase mining的相关工作,这块内容涉及的知识面比较广,知识点复杂,涉及到nlp任务的方方面面。有必要做一个整理,梳理下这块任务知识结构。
Swin Transformer:Hierarchical Vision Transformer using Shifted Windows
swin transformer
Gitalk重定向错误
详细可以参考gitalk issue
Video Understanding-视频理解
视频理解相关知识学习
vim常用命令
vim常用的命令
A Survey on Temporal Sentence Grounding in Videos
这是一篇关于Temporal Sentence Grounding in Video (TSGV)的综述。
Multi-Modal Knowledge Graph Construction and Application:A Survey
多模态知识图谱综述
hive 常用操作
记录下hive的常用操作,方便查询