2024-Q2 Summary

第二季度过去了,2024-04~2024-06。 目前是在第三个季度的中期写第二季度的回顾,拖的时间有点长了。

上一个季度 2024 第一季度回顾

研究方面 #Research

第二季度,科研上主要的进展如下:

  • SWR论文投出去了,目前还在 TII 审。从5月份到8月份了。
  • 构建了一个很大的、用于仪表识别的代码库,meter-viewer 以及 metercrnn。目前还没有开源,还在考虑。
  • 通过 torch 对之前的代码进行了重写;验证了许多新的结构。重新理解了 ctc loss。
    • CTC loss 感觉上有点老旧了,但用起来还是挺好的,性能挺不错。
    • 花了挺长时间去调试 CRNN,最后才找到 bug
    • 生成数据 CTC limitation/数据集生成
  • 修订 HIOL 论文。还有不少的收尾工作。

工程方面 #project

工程方面主要考虑了一下分布式后台任务系统。

  • 花了不少时间设计了一个可拓展的后台任务系统;based on celery。
  • streamlit 的应用

技术方面#Tech

花了一些时间去搞定 kubernetes 在本地的分布式运行。

  • kubernetes 之前遇到的网络问题也都解决了

总结

  • 研究上的进展比较顺利,新的论文已经投出去了。
  • 工程上 meterhub 不是很顺利。

下一个季度

  • #Research 新的网络结构设计,Focus on tensor shape;解决想到的网络问题
  • 搞定中期报告;把大部分研究内容落到纸上。

也可以看看