大创相关的工程我是没有上传到github的,太麻烦了,效果就就直接摆在博客里好了
2019.04-2020.04 感谢团队小伙伴共同奋斗,从申请立项,到答辩流程,项目编写,论文攥写,软著申请。虽然我们是个小团队,会议也是不出名的辣鸡会议(逃~),但无论如何,算是我平凡的大学生涯中为数不多的精彩。
也很感谢团队指导老师苏静,为人和蔼亲切,给本科生参与科研的机会,愿意尽力所能及之力帮我们拿到诸多资源。
录用通知
项目关键部分展示
登录页面
数据管理页
模型和因素选择
训练效果和模型对比
最近很火的网红算法Xgboost
预测效果
简单而形象的架构设计!
感慨
真的很开心,虽然学校有很多大佬,本科就好几个软著好几篇论文甚至还有顶会…我们也比不了。作为一名平凡的学子,那时候才大二大三,编程能力要说有多好简直是放屁,java也才学了没多久,真正的纯萌新小伙伴。从听说人工智能很牛逼,带着好奇自学python和斯坦福的cs231n课程,对神经网络有个有了大概的了解。
说起来很梦幻,大二下学期选导师,嘉鸿的导师也就是苏静老师,在搞nlp相关的东西。一天中午把我们几个叫出去,还叫了几个师兄,就这样组了个团队,可是师兄都准备秋招了,而且他们也没有搞过神经网络相关的东西。得,我们成了第一批核心成员?我们相比其他技术团队,没有师兄,没有经验,没有资源。
后来就是学习模型和框架,什么bp、cnn、rnn、lstm,也接触过sklearn、tensorflow,pytorch,opencv,概念很多,很晦涩难懂,什么梯度下降,数据集,epoch,交叉验证,loss损失,真的听个一知半解的,随之而来的是一些经典的网络结构和模型,vgg16,fastrcnn系列、ssd系列、mtcnn、mobilenet、resnet、yolo系列,都基本上只是知道有这么个东西,太多了。那时候概率论还没学,学校教的线代往往不够用,而且还要兼顾学校课程。
一开始是跟着老师搞image-caption的,也就是输入一张图像,能给出一句描述,那时候attention机制很火,加上老师本身就是搞nlp的,我们就帮她处理一些数据上的东西(打个经纬度标注什么的),老师想弄成一系列图片,生成一篇语意连贯的文章这样,idea确实很精彩,我听得都觉得很精彩,不过这事后来没消息了,不知道他们自己有没有继续搞,论文有没有发成功,将来有机会,我还想做这个!!!。老师后来也说了,搞研究方向的可能毕业了也没有成果,况且训练模型没有资源,玩具模型拿个笔记本跑啊跑,大一点的远程连接老师的服务器(好像是1080),老师就说:做应用吧。
其实我内心还是很佩服嘉鸿的,如果换成是我,这团队组不起来,嘉鸿是很有领导能力做事很靠谱的,而靠谱是我对一个人的最高评价(我就不可靠),嘉鸿可能不是编程能力最强的那个,但他肯定是最适合带队的那位。在我们都还不成熟的情况下,远见性的提出参加大创比赛,做水质决策。那段时间就是申报项目,和水产学院学生要数据(所谓广东海洋大学,比赛或者什么项目搭上了水产这条线,是很吃香的),这应该也是省级立项的很大一部分原因,嘉鸿这方面考虑还是很精妙的。
后来就是这个了,零零散散的参考了网上不少的东西,拼拼凑凑,修修改改,总算弄出个像样的东西,也加入了不少特色功能,嘉鸿对数据进行了处理(水产学院的学生记录数据能不能用点心!),我将数据放到了我的华为云(薅羊毛薅的,毕竟不用钱!),模型这块主要是嘉鸿在做,处理成sklearn的数据格式,我也帮忙写了一部分,处理了部分模型上的时间问题。结构上,模型这块紧紧围绕:
多因素交叉预测单因素
多模型对比
模型融合和提出择优算法
文德和慧玲的中途加入,我后来也转向了java后台,web这边是我和文德在搞,web这边封装数据给python,用于模型的训练和预测,逻辑上有交叉,数据处理起来比较困难。因为是水质决策和预警,文德不了解模型,嘉鸿不了解后台,只有两边我半斤八两!我又将水质预警功能嵌入在模型训练的评价之后,后来又加入了特色的邮件提醒功能小彩蛋…慧玲前端,让整个项目的视觉效果提升了不少,明杰负责主要论文编写,大家一起慢慢的就做完了。
真的很感概,团魂max,在大学也拼过也闯过,不至于是个碌碌无为的四年。