• 中文 (中国)
  • English
  • 第五届大数据与计算智能研讨会

     

    0-1

    为了更好地推动我国大数据科学与脑机智能的研究及应用,由北航大数据科学与脑机智能高精尖创新中心发起主办的“第五届大数据科学与计算智能研讨会”于2018年9月22日至9月23日在北京西郊宾馆5号楼金缘厅召开。

    大会邀请了海内外大数据及人工智能领域顶尖专家学者及产业界专家进行主题演讲,并汇聚领域内的优秀骨干人才共同探讨大数据与人工智能的最新研究方向及产业成果。本次会议是“北京航空航天大学计算机学院建专业60周年系列活动”之一,会议得到了北京市教育委员会、北京航空航天大学医工交叉创新研究院、北京航空航天大学计算机学院和国家973计划“网络信息空间大数据计算理论”项目组的大力支持。

    yc1

    yc2

    大会特邀报告



    报告人:郑志明院士(大数据科学与脑机智能高精尖创新中心首席科学家)

    报告题目基于大数据的确定性小概率事件发现方法

    zzm


    报告人:朱文武教授(清华大学计算机系副主任)

    报告题目数据驱动的复杂社交系统动力学建模方法研究

    zww

    摘要:

    社交网络大数据具有时间动态性和空间复杂性的特点。传统分析方法基于物理建模用动力学模型试图刻画此类动态变化的现象,并解释其变化原因。当面对数十亿节点数百亿条边的复杂社交系统,动态变化现象体现在宏观网络,中观组群,微观用户行为,及信息在网络上的动态传播等不同尺度的场景,传统动力学模型难以刻画此类复杂社交系统的动态变化现象。我们通过数据驱动的动力学模型,第一次很好地刻画了上述复杂社交系统(微信,微博等)的动力学现象,并进一步解释其变化机制。我们提出的数据驱动的动力学建模研究方法,试图为建模,理解,预测真实大规模社交系统奠定一定的理论基础。我们所提出的研究方法在腾讯微博微信数据进行了实验验证。最后,介绍我们正在研究的将机器学习和物理建模相结合分析社交网络大数据的动态结构演化规律的研究范式。


    报告人: 裴健(京东集团副总裁)

    报告题目:未来零售、智能供应链与数据科学 

    pj

    摘要:

    零售的未来在于突破目前商业模式所面临的客户界限、货物界限和店场界限。突破这些界限的关键技术是含括智能消费、智能物流和智能供应的一体化智能供应链。智能供应链的核心和基础是智能化的大数据科学。这个报告将通过一系列实例,介绍未来零售及其背后的智能供应链技术和数据科学应用。


    报告人:浣军教授(百度北京大数据实验室主任)

    报告题目:AutoDL: 自动设计深度学习网络, 支持开放普惠AI 

    hj

    摘要:

    人工智能对于当今社会各方面正在发挥巨大影响。今天AI不仅仅是简单地提高一些行业的效率,而是可以从根本上改变信息、金融、医疗乃至交通、运输等等行业的面貌。某些人类的简单重复性思维(如图像、语音识别),人工智能算法在正确率、持续性和可扩展性上都更具有优势。而从数据上提取更深刻的特征等方面的能力,AI也超过或正在超过人类。在AI的研发中, 设计高效的深度学习网络是一项关键核心能力。此项能力主要掌握在高校和大公司的研发中心。 在这次报告中我们简要介绍百度大数据实验室在利用深度学习来设计深度学习网络结构的工作: AutoDL。利用AutoDL, 我们提出开放普惠AI的理念, 助力AI在各行各业的应用, 支持广大中小初创企业。 

     


    报告人:陈贵海教授(上海交通大学教授) 

    报告题目:基于立体精准画像的学术分类与推荐项目简介

    cgh

    摘要:

    学术同行评价是国家科技计划组织实施和评审评估的核心环节,全面、合理、精准、可信的学术同行评价有利于促进广大科研人员积极参与科技创新研究工作,进而促进国家的科技发展与进步。本项目基于学术大数据,研究基于立体精准画像的学术分类与推荐系统,以解决当前人工挑选评审专家耗时费力且很难公平公正的问题。针对学者人数众多、数据庞杂对遴选评审专家的挑战,研究并实现科研行为数据库、多维学术画像、精准推荐、可信溯源与隐私保护等一系列前沿关键技术及系统,并在科教领域进行示范应用,形成相关规范和标准,为遴选专家的 “高效化、精准化、可信化” 提供技术支撑。


    报告人:徐洁教授(大数据科学与脑机智能高精尖创新中心首席科学家)

    报告题目:Distributed Computing at Scale: The long-tail problem in a computer system with hundreds of thousands of servers  

    xj

    摘要:

    This talk will address the long-tail problem in a computer system with hundreds of thousands of distributed servers, such as Google’s Cloud datacenter and Alibaba’s Fuxi system. The system is able to run tasks of an application in parallel and hence execute the application rapidly. However, when the application contains many tasks (e.g. from hundreds to thousands),there will be always a small numberof the tasks that make slow or no progress (i.e. forming a long tail), thereby affecting the completion of the application. The industry developed some simple solutions, including kill and re-try, massive task clones, and speculative execution, which are costly and ineffective.

    Wefirst investigated the root causes of the long-tail problem by analyzing real-world datacenter tracelogs, including operational data sets from Google, Alibaba and Adapt (UK), anddeveloped a system model that captures a datacenter’sbehavioural characteristics. The model was then trained extensively using the tracelogs, able to predict the system’s run-time behavior in an accurate fashion. Tasks can be now scheduled intelligently based on the behavioural prediction, leading to the efficient execution of an application and at the same time the efficient utilisation of server resources.


    报告人:于辰涛教授(联想大数据业务执行总监)

    报告题目:联想工业大数据平台的技术创新及产业实践

                Lenovo Industrial Big Data Platform Innovation and Practice

    yct

    摘要:

    通过工业大数据技术突破,如何帮助中国骨干企业实现IT和OT领域的智能制造数字化转型。通过工业物联网技术,实现生产和制造领域的现场接入,实时决策和智能化机理优化。突破数据内存计算引擎,实现平台10x~100x相对于开源产品性能提升,构建千亿级数据的多表秒级即时分析能力。通过人工智能和机理模型,帮助数十个企业构建全面产线优化,供应优化,用户营销和客服优化能力。

    To help the Chinese key enterprises to achieve the digital transformation in both and IT and OT area with industrial big data technology breakthrough. To establish the capabilities of field data acquisition of production and manufacturing, real time decision and intelligent mechanism optimization with industrial IOT technologies. To achieve the second-level real time computing and 10x~100x performance improvement comparing with mainstream platform under 100B scale association query scenario with in-memory computing technology breakthrough. To enable the comprehensive production line optimization, supply chain optimization, marketing and services optimization of dozens enterprise with AI and mechanism models


    报告人:王坚 (阿里巴巴集团技术委员会主席)

    报告题目:城市大脑与数据资源

    wj

     


    报告人:吴信东教授(明略数据首席科学家和副总裁) 

    报告题目:大数据知识工程

    wxd

    摘要:

    大数据面向异构自治的多源海量数据, 旨在挖掘数据间复杂且演化的关联。大数据知识工程(BigKE)从大数据的 HACE定理开始, 从大知识建模的角度,旨在利用海量、低质、无序的碎片化知识来构建新型的知识生成和知识服务平台。不同于依靠领域专家的传统知识工程,BigKE除权威知识源以外,知识主要来源于用户生成内容(UGC: User-Generated Contents),具有海量异质的特点,知识库需要自完善与增殖能力,问题求解过程根据用户交互进行学习。本报告介绍HACE定理、BigKE模型,从大数据到大知识的角度,分析和例证行业人工智能研发中的大知识服务。


    报告人:王建民教授(清华大学软件学院院长)

    报告题目:“清华数为”大数据软件栈及其核心构件

    wjm

    摘要:

    针对大数据系统软件开源生态发展现状、大数据系统软件技术与领域应用发展的迫切需求与工程化瓶颈,系统地介绍了大数据系统软件共性技术的研发思路,以及大数据系统软件国家工程验室研制的“数为平台”的技术架构及其核心构件,并分享在工业制造业、气象环保服务领域开展应用验证情况。


    报告人:李涓子教授(清华大学教授)

    报告题目:知识引擎:让知识赋能机器智能

    ljz

     


    报告人:赫然博士中科院自动化所模式识别国家重点实验室研究员  

    报告题目:视觉大数据生成

    hr

    摘要:视觉大数据是大数据的重要组成部分,其生成是通过对图像或视频的内容进行重组或再生,进而创造出在内容或表观上完全不同的视觉数据。无论是在影视、文化、艺术和安全等领域,还是在人们的日常生活中,视觉大数据生成都有着广泛的应用。由于视觉数据维度高、体量大,因此生成高维、真实的图像和视频数据一直是机器学习和计算机视觉等领域的重要研究内容和长期研究目标。本报告介绍视觉大数据生成相关的视觉信息采集、视觉认知机理和概率学习模型(生成对抗网络和变分自编码机),从机器学习理论到视觉应用方法,分析视觉大数据的智能行业需求以及对人工智能发展的影响。


    报告人:朱其立教授(上海交通大学教授)

    报告题目:Knowledge Base Question Answering via Encoding of Complex Query Graphs

    zql

    摘要:

    Answering complex questions that involve multiple entities and multiple relations using a standard knowledge base is an open and challenging task. Most existing KBQA approaches focus on simpler questions and do not work very well on complex questions because they were not able to simultaneously represent the question and the corresponding complex query structure.
    In this work, we encode such complex query structure into a uniform vector  representation, and thus successfully capture the interactions between individual semantic components within a complex question. This approach consistently outperforms existing methods on complex questions while staying competitive on simple questions.


    会议联系人:

    马帅

    电话Phone: 010-82338293

    邮箱Email: mashuai@act.buaa.edu.cn

    董仙慧

    电话Phone: 010-82338234

    邮箱Email: dongxh@buaa.edu.cn