从数据中台到数据生产力最新实践.pdf

想预览更多内容,点击预览全文

申明敬告:

本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己完全接受本站规则且自行承担所有风险,本站不退款、不进行额外附加服务;如果您已付费下载过本站文档,您可以点击这里二次下载

文档介绍

从数据中台到数据⽣产 最新实践

Agenda • ⽹易数据中台的建设过程 • 数据中台模式下新的探索实践 • 数据中台最终要⾛向数据⽣产⼒ • 数据⽣产⼒在⽹易的实践探索

⽹易数据中台的建设过程

⽹易杭州研究院 公共技 术研发 ⾳乐 电商 教育 物流 农业 零售 前瞻技 术研究 华夏银行 传媒 办公 邮箱 电⽹ 教育 ⾦融 创新产 公共数据建设 ⼯具产品平台 数据建设⽅法论 品孵化 ⽹易易数

2018年数据中台之⻛骤起 你搞清楚这么多的概念了吗? concept infrastructure product use 数据仓库 数据湖 ⼤数据平台 数据中台 • Oracle/IBM • HDFS/ODPS • ⽹易猛犸/Dataworks • ⽹易易数/Dataphin • 四要素 • 数据⽆格式 • ⾯向数据研发场景 • OneData、OneService • ⾯向决策场景 • 流量数据、计算、存 • ⼤规模任务研发 • 数据使⽤效率、质量和成 储规模 本

⽹易建设数据中台前架构(以⽹易电商为例) 精准⽤户运营 仓储调拨 智能客服 异常交易识别 商品推荐 标签画像 智能补货 退货助⼿ 评论反垃圾 内容推荐 市场运营 供应链 仓配客 ⻛控 算法推荐 ⼤数据平台

带来了什么挑战? 效率 质量 成本 • 需求交付速度慢!平均需要一 • 平均每周10个数据质量问题, • 考拉有58.75%的表30天内都 周时间。 数据团队花费大量精力在故障 没有访问,占用了4.5P存储空 定位和恢复,数据使用方对数 间 • 找数据难,几万张表,不知道 据不信任! 有哪些数据! • 传媒有72%的表30天内都没有 • 平均每个Q有9个因为指标口径 访问,占据了6P存储空间 • 报表加载速度慢,有30%报表 不一致反馈的数据问题! 无法在5秒内打开 • 严选有63.67%的表30天内都 • 90%的

最近下载