2019年12月29日,数据科学与工程学院2019年度企业奖学金成果展示会在中北校区逸夫楼三楼多功能厅举行。校内外专家、企业代表、各地院友及全院师生出席展示会,与本年度21个获奖项目负责人深度交流。
展示会现场,各项目通过海报展板及demo,对成果进行全方位、生动展示。获奖项目涉及领域广泛,涵盖教育、医疗、金融、交通等多个领域;内容详实,展示了数据学院学子基础扎实、学以致用的良好素养。项目负责人耐心回答观展嘉宾提出的问题,认真听取专家、老师的意见建议,积极与同学朋辈分享科研经验。现场互学、互鉴氛围浓厚。
为鼓励广大学子学习优秀、积极投身科研,展示会现场还设置互动奖励环节。观展同学在各项目展位前可收集印章、参与抽奖;若能在交流时提出优秀问题,将获得项目组提供的特别奖励。
与此同时,每位观展嘉宾、老师和同学也对最欣赏的项目进行“点赞”,为其送上鼓励卡片。最终,《研究生导师画像》、《基于开源协作模式的在线实训平台与行为数据分析》和《小微商户贷款预授信金额预测》等三个项目荣获本次展示会“最具人气奖”。
【项目一览】
l 高素婷
小微商户贷款预授信金额预测
预授信金额是收钱吧贷款业务商户运营中的重要抓手。此项目通过对第三方资金方预授信金额的拟合来探索市场上对商户经营能力评估的重要特征,通过输入商户的基本信息和经营情况,输出一个合理的预授信金额。
l 马源航
音乐相册生成
此项目运用人工智能技术为用户选定的一组照片或视频配合合适的背景音乐,自动产生音乐相册。项目团队基于图像和音乐的情感分析,运用跨领域的情感匹配方法实现图像和视频的自动配乐,从而大大缓解了海量数据产生的信息迷航问题。
l 周添一
基于开源协作模式的在线实训平台与行为数据分析
开源大学是由华东师范大学数据学院与X-lab开放实验室联合发起,旨在通过开源技术搭建一个免费开源的动手实训平台。平台既使用了众多著名的业界开源软件,诸如Docker、Kubernetes、React等等,还包括团队自己发起的开源项目,如GitCourse、MgrBot等。
l 陈启航
利用GPU加速分布式数据处理
分布式数据处理理论上可以通过节点的扩充线性增加集群处理性能,其本质是对大规模数据进行分区后各自处理。但对于一些计算密集型任务仍然需要使用GPU加速计算。此项目的意义就在于能够在分布式的场景下充分使用GPU资源实现对计算密集型任务的加速处理。
l 朱仁煜
研究生导师画像
此项目通过构建系统,用以辅助研究生教育质量分析与决策。系统分为个人画像、学校画像、省份画像、区域画像和全国画像五个模块,运用统计、数据挖掘和机器学习方法实现数据标签化得到个人画像结果,然后通过聚合查询和聚类分析,向上聚集得到群体画像结果。
l 苗德壮
C语言习题知识点标签自动生成
此项目认为使用文本多标签多分类技术,可以实现智能标注工具,在OJ上实现做题反馈,为每一道题目打上知识点标签。现已完成构建完整的C语言知识点标签体系,收集适合C语言学习的习题,并在已标注的数据集上,训练了部分基于深度神经网络的多标签多分类模型。
l 牛悦安
基于微信小程序的校园公开信息聚合系统
此项目来源于生活,也实现了真正的为生活服务,主要注重实用性以及交互性。项目开发的EC&U微信小程序现已实现校园信息查看、个人日程表、信息识别、海报上传识别、时间规划等功能。
l 刘伽椰
智能分货
智能分货是钢铁物流行业最关键的问题之一,其核心任务是确定每辆卡车的货物装载计划。此项目完成了与京创汽运平台的合作项目,实现了智能分货模块。另外还提出了基于数据驱动的货物装载计划决策框架。
l 孙军
swNGA-II:Parallelization and Optimization of NSGA-II on Sunway Taihulight System
此项目研究了NSGA-II算法,并结合分布式GA中的分岛模型以及主从模型提出了一个两层层次并行NSGA-II框架;还提出SW26010处理器上基于寄存器通信(RLC)的核心间数据交换范式;并应用了多种性能优化方法,包括双缓冲、向量化、数据复用技术等方法。
l 戚晓冬
BFT-Store:基于纠删码的联盟链数据分片
此项目鉴于拜占庭容错协议(PBFT)和纠删码技术,设计出BFT-Store,在区块链系统中,将每f+1个区块进行编码,产生3f+1个块,并将其分布在不同节点中,将原来每个区块的存储代价从O(n)降低至O(1), 并且利用多备份与缓存策略降低了查询区块时解码的概率。
l 蒋栋磊
智能车辆调度系统
传统的车辆调度通过签约车队方式进行,掌控权在车队长,企业无法有效节约成本。而车队长又无法充分利用运力。智能车辆调度系统通过整体优化模型和派单优化模型,能提高司机接单意愿,能在整体范围充分利用运力,代替车队长进行车辆调度任务。
l 张绪坤
儿童青少年脑智发育追踪研究
此项目为脑科学与教育创新研究院“儿童青少年脑智提升项目实现信息化系统规划与构建”的一部分。其内容包括入组与心理测试系统、实验程序集成系统、平台管理系统、数据管理与智能分析系统、分布式数据存储平台、高性能计算资源部署等。
l 朱鹏
金融新闻的智能化处理
此项目利用训练好的命名实体识别模型和一些其他模型(新闻分类模型),对新闻进行智能化的处理,例如判断新闻是否重要,并对新闻进行分类,并识别出这篇新闻里的政府机构、上市公司、涉及到的产品和机构,并找出这篇新闻的5个关键词等等。
l 储佳佳
LATTE: A Native Table Engine on NVMe Storage
此项目基于NVMe SSD的轻量存储栈,提出了Lightstack框架。它整合了数据库的存储引擎层和文件系统层,在用户态提供了更短的I/O路径以实现超低延迟。并构建了一个表存储引擎LATTE在用户空间中提供有效的数据服务,而无需表和文件之间的数据转换。
l 陈梓浩
利用增量加速分布式矩阵计算
分布式矩阵计算常见的应用是迭代算法,在这些迭代中由于输出元素收敛速度的不均匀会导致大量对已收敛元素的重复计算。此项目针对这一问题,开发了IMAC,引入了增量计算以利用元素非均匀收敛的特性,并动态地在全量计划和增量计划之间选择最佳的执行.
l 李宇明:
Lauca:生成面向应用的合成负载
此项目将oltp-bench生成的TPC-C负载作为模拟对象,使用Lauca采集负载信息,生成合成负载。将两种负载在相同的数据库系统上运行相同的时间,然后通过检查二者插入新订单的数量(tpmC),比较两种负载运行时数据库系统的性能差异,发现其相差不超过10%。
l 梅文娟
基于机器视觉的健身姿态识别和纠正向导
此项目是基于机器视觉的健身姿态识别和纠正向导,主要内容是基于人体的二维及三维姿态,设计了一个健身姿态评价系统,实现对健身视频中人体姿态的评分和纠正。该系统主要完成双目图片矫正、视频关键帧提取、人体姿态数据采集动作评分和呈现纠错提示等功能。
l 贺小龙
大规模历史事务数据的合并优化
此项目研究在对分布式数据库进行持续批量导入数据时,系统如何根据节点之间的导入负载情况进行负载均衡。项目利用机器学习模型预测每个节点的导入负载,最后根据预测结果进行导入负载的均衡。均衡的最终效果是让系统中的各个节点之间消耗的时间方差较小。
l 魏星
面向分布式数据库的全局共享缓存实现
此项目当前主要研究如何利用RDMA实现高速的共享缓存,并探讨将其部署在分布式数据库系统中以提升性能。其解决方案位构建了一套高性能的分布式共享缓存,并提供了一套SDK接口,为数据库系统提供高性能的的范围扫描服务。
l 韩明聪
Porg——浏览器中的分布式计算框架
Porg是一个将计算节点运行在浏览器上的通用分布式计算框架,以 MapReduce 模型为基础,同时还提供了 MapOnly、MapCache 两种作业模式,只需要部署 PorgServer,就可以通过在浏览器中打开网页的方式,参与到分布式计算任务中。
l 杨东明&王道江
研究生院信息平台
此项目数据学院与华东师大研究院合作研发的研究生院信息平台,目前已提供给学校近5万学生与5千教职工使用。系统基于微服务与spring技术栈实现,采用了诸多企业级应用框架,采用敏捷开发实现版本的快速迭代,并采用k8s实现容器的高效管理。
下午15:00,本次展示会圆满结束,项目成果得到大家一致好评,也激励更广大同学见贤思齐、奋发向上。
数据科学与工程学院成立三年以来,始终坚持“应用驱动创新”理念,开放办学,积极引入社会资源,通过设立企业联合实验室,培育、孵化兼具专业性与实用性的科研项目,通过设立企业冠名奖学金,表彰、奖励在学业、学术研究、创新创业上取得突出成绩的学生。今年,共有22名学子获得6家企业提供的奖学金,其参与的21个项目亦充分展示了院企合作、协同育人的实效。数据学院将继续深化、优化育人模式,面向未来,砥砺前行。
文案:刘文欣
摄影:刘文欣
排版:甄逸飞