开云官方网站ICDM‘22杯具小杯具知识结
更新:后来改投sdm中了,kdd/icdm/sdm号称数据挖掘三大会,不过sdm感觉一直在退步。。
19年在阿里云团队实习,主要做目标检测和属性识别以及落地中的剪枝/量化等工作。关于目标检测方向的梳理,主要在这篇文章:
之前知乎是真的容易涨粉,随便写了几篇就有三四千粉丝了,水文也被多个公众号转发,比如@CVer计算机视觉及@极市平台就转发好几次,可惜因为一些原因注销了原来的号。
20年校招入职,彼时部门调整开云官方网站,实习的leader离职去了华为云,mentor和leader变成了达摩院,工作方向也变得有点半科研半业务。这段时间主要做基于GCN的人脸聚类方向,在实际业务中,抽象出技术问题进行研究,然后应用于业务。基于GCN的聚类有三个主题:基于GCN node分类的人脸聚类,基于GCN edge分类的人脸聚类,基于 GCN的cluster denoising。目前node在mm挂了之后经过修改已中ICLR‘22,denoising篇CVPR挂了后转投NeurIPS在审。而edge篇,则是本文要说的,最开始做出效果最快,却是最曲折,至今还在曲折。
21年年初,因为部门变动,达摩院的mentor不再指导我,前mentor需要帮达摩院其他小弟改论文,论文准备了一半的我,有点不知所措。思考再三,选择从cv转到搜广推。关于职业生涯的选择和变化,我也专门总结了一下,感兴趣的朋友可以一起交流。
因为两个改进点只做了一个,就随便投了篇workshop,没想到还拿了个industrial best paper的奖项(虽然也没什么用)杯具知识,有意思的是现在有两个引用。本来个人觉得另一个改进没做,工作量不够,比较水,之后发现清华和腾讯联合发的另一篇,问题定义相似,但具体方向不同,方法个人觉得并不比我的好,结果中了NeurIPS‘21,于是觉得自己也可以,就选了当时时间合适的数据挖掘会议ICDM。
问了一下同学,说是这个会相对比较难,他是ICDM挂了,缩短一下中了AAAI,当时也没太当回事,直接原文转投了,现在想来真的是太懒。论文前mentor友情帮忙修改了abstract、intro和conclusion部分,其他部分都是我随手一写,也没做太多认真的修改,而且换到ICDM的模版只有不到7页,这个会要求10页内。这里大家还是应该吸取教训,认真对待,也许中和不中一念之间,如果遇上审稿人认为你态度不好,可能就比较负向。另外,对学术还是应该心存敬畏之心,不要总觉得这个水那个水。开云官方网站
最近出了审稿结果,其实比想象中更好一点,reviewer给的评价accept/marginal/reject各一个,但是那个reject让我挺不满的。可能是轮到自己开云官方网站,就自我感觉良好吧。他列的三个缺点,第一是没引用重要文章,然后列了篇2009年的论文,个人真的不觉得那篇不引用也是错,不然可能我得引用几百篇了,有点类似,你发分类的文章,怎么能不引用LeNet呢?更不用说他列的那篇只是老古董,在细分领域的地位完全没法和LeNet在分类的地位相比。第二是实验不够充分,个人认为有可能不够充分,但是值得商榷,我基于CVPR的一篇文章,在人脸聚类数据随机生成了八个不同分布的数据集,在Fashion聚类数据随机生成了两个数据集,两个领域10个子数据集上做了实验,并且在全量数据集也做了实验以用于和baseline对比,说明不是只适用于特意构造的数据集,ablation study,也用折线图比了各部分,实验即使相比实验多的论文没那么充分,比如有的文章可能分类、检测各种实验全做,但实验也没不充分到给reject的地步。第三是语言表达不够好,然而其他reviewer也有夸赞表达不错的。以及摘要就写了会开源代码和数据集,是否开源相关选项这个reviewer居然选择不适用。。
总之,这个reject个人很不满意,开云官方网站强烈谴责,虽然也没什么用……其他的会,可能这样的评价还是有可能中的,比如前文说的ICLR以及最近我们组新中的RecSys,里面都有一个reject,但是ICDM完全没机会,应该是直接挂了,我没找到有PC的评价。不管怎样,重投吧,也许失败比成功更值得纪念,因为过程中可以学习到很多。
有意思的是,ICKG(国际知识图谱大会)发了个直接录用,这个会议主席也是ICDM的创办者和主席,EI检索,毕业有需要的话大家可以考虑一下。