返回目录:旅游景点
2015年12月10日至12月12日,由中国计算机联合会(CCF)主办,由CCF大数据专家委员会主办,中国科学院计算技术研究所、北京中科天吉科技有限公司和CSDN协办,主题为“数据安全、深度分析和行业应用”的2015中国大数据技术大会(BDTC 2015)在北京皇冠假日酒店开幕。
2015年中国大数据技术大会第三天,来自北京交通运行监控调度中心、神舟专车、高德、携程、屯留和土家族的六位专家教授分享了政府和企业在交通和旅游领域使用大数据的实践。本次论坛由CSDN副总编辑董世笑主持。

北京交通运行监控调度中心副主任张克:北京综合交通运行数据系统的建设与应用
北京交通运行监控调度中心(TOCC)成立于2010年底,成立于2011年5月。它是北京综合交通协调系统的重要组成部分。目前,运营监控系统、协调调度系统和信息服务系统的整体业务模式已经形成。

张克谈到了北京的交通运行综合分析监测数据系统。根据庞大的基础数据内容和数据量,针对综合交通监控和运营分析需求,通过总结和梳理数据层,结合数据源和数据访问方法,统一设计数据存储结构。围绕城市路网区域和路段的运行特点,构建了交通指标、运行速度和拥堵持续时间等7个指标项。根据自动售检票系统和运营数据,构建了轨道交通动态客流指标、客流指标和列车运营指标。通过出租车全球定位系统数据和出租车计价器数据,构建出租车通行能力指标、运营特征指标、运营安全性指标和标准指标。通过对交叉领域相关性强的数据项进行深入挖掘,提出了反映城市综合交通运行特征的相关指标,如轨道交通客流比例、公交速度比例、城际客流比例等综合指标的定制多粒度复合特征提取。


神舟专用车总建筑师李思:神舟专用车时间大数据处理实践空


在整个框架内,通过车辆网络/OBD实时收集和处理数据。同时,离线分析机器学习形成了一个预测模型来对服务前端进行调度和定价。驾驶员/乘客前端请求再次返回调度、财务和其他子系统进行数据分析。之后有一套商业智能处理和分析系统,以MySQL模式收集数据库中的数据,最终生成商业报告。同时,前端收集许多用户的访问日志,形成用户事件流,便于分析用户行为。通过驾驶行为分析和报警来保证用户的安全;提高驾驶员油耗效率、有效里程分析等方式。空划分网格,根据网格中的时间预测供需,提高调度效率;用户数据分析平台通过用户历史订单、访问日志、优惠券收集和使用以及社交网络共享记录等数据分析,实现用户肖像和准确营销。具体施工方法如下:
将用户操作以及由其引发的系统状态变化都定义为事件;把多个异构数据源中的事件按用户聚集;把同一用户的事件按时间发生的时间排序,成为用户事件流;按业务需求定义一批基于用户事件流的基本函数(API);使用Hive或者MapReduce进行数据分析。演讲结束时,李四分享了神舟专用车在大数据处理方面的经验。对于初创企业来说,会出现租用机房资源紧张、大规模营销活动容易造成系统过载等问题。此时,企业可以与第三方企业和大学密切合作。同时,非核心组件(降低系统组件之间的耦合度)、大规模营销活动、第三方合作和短期计算密集型任务可以部署在云(Iaas)上,以达到提高安全性、可靠性、灵活性和成本控制的效果。
方兴未艾的高德交通大数据高级专家:大数据如何引导出行
交通大数据高级专家高德,方兴未艾的演讲主题是“大数据如何引导出行”。高德生产和消费的都是数据。通过这些数据,我们可以更好地了解旅游、地理信息和相关服务,为未来的业务提供更好的支持。


基于这些数据,高德做了大量的数据挖掘工作。首先,通过将轨迹热图与现有道路网络相结合,他发布了新的和过期的道路信息。第二是通过分析交通流量变化和用户报告的事件,实时监控道路关闭和交通事故。三是分析历史速度,建立道路速度模型,预测路况。这些方法相互关联后,可信度或质量和准确性将大大提高。有了这些方法,用户在进行路线规划或确定旅行时间时会更加准确。

携程基础大数据高级数据分析经理雷宇:携程基础大数据架构实践
携程基本大数据高级数据分析经理雷宇分享了“携程基本大数据架构实践”。对于在线旅行社行业的电子商务公司来说,其大数据应用可能相对简单。例如,携程有15或16条业务线,但如果你打开京东或天猫1号,你会发现有4000多个类别。
OTA公司的数据具有业务线差异大、复杂性高的特点,其大数据登陆场景往往是分析报告、AB测试平台、用户中心、个性化推荐域、精确操作等。目前携程拥有20个业务单元和相应的数据团队,但也面临着许多问题,如数据源多、标准不同、ETL流程管理困难、各级跨业务单元数据使用困难等。

目前,携程大数据架构分为五层:精确应用层、通用配置层、算法引擎层、日志层和数据源层。其中,数据源层用于规范埋设点的注册和生成,并进行实时环境验证(提前)、ETL数据验证(进行中)和离线验证报警(事后);追踪MQ(卡夫卡等)。)在日志层中用于离线和。实时数据访问,并打开MQ、API服务、配置单元表外部接口;在算法引擎层,通过离线用户肖像、相似相关商品、规则挖掘、主题挖掘(HBase、Redis)和实时:用户意图(HBase、Redis)分析,以及Hive、ES等方法,实现了模型验证肖像审计、ETL中的模式识别、测试环境中的血缘关系审计。通用配置层通过通用精准营销平台(正在开发中)实现数据导出,如魔方选择(广告、短信、应用推送、EDM)、个性化推荐平台、选择平台等。精确应用层用于推荐字段和个性化广告传递。

在质量保证会议上,雷宇详细回答了与会者提出的嵌入点技术和用户建议中考虑的维度。
头牛大数据总监孟景慈:头牛旅游大数据的应用实践
头牛大数据总监孟景慈发表题为“头牛旅游大数据应用实践”的演讲。他的演讲分为三个部分:头牛商业模式、旅游业特点和数据解决方案。目前,头牛的商业模式分为三个部分:旅游电子商务、金融技术和影视媒体。目前,作为重心,最重要的是去头牛旅游。头牛从自助开始,跟随一个团队,这不同于携程的模式。现在也有机票、酒店、机票、签证和wifi,但传统上最重要的是跟随团队和自助。

旅游业具有非标准化、高/低频率、时效性强、单价高的特点。旅游业是一种非标准产品,它会产生非标准的衍生需求:如何整合资源?在这方面,头牛采用产品对同类产品进行促销和自动包装的方式,将资源交叉销售给相关资源。他说头牛不是完全低频,至少在应用时代,应该在高频和低频之间。头牛有目的地资源。基于位置服务的推荐系统可以向用户推荐围绕旅游或吃喝玩乐的表演,实现旅游的移动化。在供应商的短期内,已经实现了更高的频率。Touniu供应商平台N-Booking现已拥有数万注册用户,SKU占NB条目的85%以上,SKU数字达到数百万,订单NB确认率超过95%。

土家族商业智能总监秦永:土家族网络数据分析的商业实践
土家族商业智能总监秦永分享了“土家族网络数据分析的商业实践”这一主题。他简要介绍了土家族是一个全球性的公寓和住宿预订平台,覆盖中国265个城市和海外1038个城市。他这次分享的重点是:数据的价值在于技术和商业的结合;数据在技术上已经深入发展,并在商业实践中蓬勃发展。秦永的演讲通过分享土家网络在商业实践中的4个案例,与大家讨论了“数据如何在商业层面与商业互动”。

与传统的在线旅行社相比,土家族企业对3人以上的家庭有更多的假期需求。有30种产品可供选择:公寓、复式住宅、别墅、游艇等。20%的用户决策周期(从浏览到购买)超过1天。因此,有必要解决度假需求往往没有明确的目的地或含糊不清的问题,有必要帮助用户解决“去哪里”的问题;产品种类繁多,有必要帮助用户决定“住在什么房子里”:用户做出缓慢的决定,需要帮助用户加快他们的决定,回答“这些房子怎么样”这三个问题。
通过对“去哪里”案例1中数据的分析,土家族获得了以下三个特征:
不管任何时候,同城预订订单占比很大;大部分时候,周边游仅次于同城预订;城市之间的往来度假是有规律的:进入冬天,东北和西南去三亚的人增幅最大。因此,途家相应推出了三个业务应用:
在途家PC首页根据用户所在地,做了目的地智能推荐;智能推荐里面明确了本城市房屋推荐、城市周边推荐,其他城市推荐;加强了线下门店的同城品牌推广。在案例2中,通过收集用户的历史数据来发现规律。根据总结的规则,每个房子都有一个合适的旅游目的,方便用户选择。在案例3中,加强用户信息需要一些感性的评价:阅读评论,但有两个问题:有很多评论,过程一般在后面(细节页面)。通过文本挖掘,我总结了每所房子的印象,并提前显示在列表页面上。

第二,没有固定的数据分析方法。测量业务通常是基于对业务的深刻理解的简单操作。数学模型经常用于商业预测。第三,业务部门中数据分析师的轮换是提高数据分析结果价值和加强数据与业务之间互动的有效途径。
欲了解更多精彩内容,请关注直播主题2015中国大数据技术大会(BDTC),新浪微博@CSDN云计算,并订阅CSDN大数据微信号。