每日优鲜如何搭建数据仓库？

包公PM 2023-07-26 02:01:48

一、为什么要做数据仓库&数据仓库的结构

国内生鲜销售渠道中农贸市场占73%，而超市渠道渗透率仅为22%，相比与发达国家70%以上的水平，仍有较大差距。

随着新零售的风口刮到了社区生鲜领域，社区生鲜近年来仍密集开店，一是行业巨头降维打击，布局“社区生鲜”市场，二是生鲜传奇、钱大妈之类的小品牌井喷式爆发。

PEST分析：

国家政策：

国家大力发展在线农产品交易，对农产品超市进行补贴。并于2017年出台的《商务部中国农业发展银行关于共同推进农产品和农村市场体系建设的通知》，其中主要支持方向为：

农产品市场及仓储物流设施建设。支持新建、改造各类农产品批发市场、综合加工配送中心、产地集配中心，完善预选分级、包装、仓储、物流等设施。
公益性农产品市场体系建设。支持公益性农产品批发市场建设公共加工配送中心、公共信息服务平台、检验检测中心、消防安全监控中心、废弃物处理设施等公益性流通基础设施。支持建设公益性菜市场、平价菜店等公益性农产品零售网点。
农产品冷链物流体系建设。支持建设、改造标准化冷库和冷链物流集散中心，提高农产品产地预冷、低温加工、冷链仓储配送能力。推动封闭式交接货通道、月台、货架等设施标准化改造，加快绿色环保冷藏冷冻设施设备与技术应用。

因此为在线生鲜的发展打开了政策渠道。

经济发展：

我国今年来经济快速发展，经济发展带动了人民的消费欲望，在线生鲜电商打开了网上生鲜买卖的渠道。

社会现状：

目前人们的消费水品提高，人们越来越关注农产品的安全问题，因此人们很多希望能够直接从农产品生产地直接拿货，既保证了食品安全，又对价格满意；并且随着人们网上购物的习惯养成和物流运输水平的发展，人们网上采购生鲜类产品的意愿也在加强。

技术现状：

随着AI大数据以及物联网等新技术的诞生，保质期短的生鲜产品能够在特定的时间及时送到用户手中，并对用户反馈的数据进行追踪，既提高了用户的满意度，同时也能够保证食品的安全和新鲜。

综上所述，生鲜网上发展正处于快速成长期，市场份额将越来越大。

每日优鲜成立于2014年，2018年已完成水果、蔬菜、乳品、零食、酒饮、肉蛋、水产、熟食、轻食、速食、粮油、日百等全品类精选生鲜布局，因此SKU非常丰富，作为配送类产品，每日产生巨大的数据量。

每日优鲜能够做了更多精准的触达。媒体环境变得越来越精准了，这要求我们作为一个零售商或者广告主，也会在算法上越来越精准。因此我们猜测每日优鲜具有自己的OLTP。

伴随着新零售到来的步伐以及社区团购迎来的新风口，电商巨头们亦纷纷布局生鲜电商。阿里有盒马鲜生，京东有7Fresh，苏宁有苏鲜生，步步高有鲜食演义，同一赛道角逐的还有美团的小象生鲜、易果生鲜、天天果园、大润发优鲜等，生鲜电商的抢滩战未来将更加激烈。

产品经理，产品经理网站

因此，根据以上产品分析，每日优鲜需要搭建自己的数据仓库，用于公司决策，精细化运营。

产品经理，产品经理网站

每日优鲜维度分析：

产品经理，产品经理网站

数据集市矩阵表：

产品经理，产品经理网站

数据源分为三种：

结构化数据：一般是业务数据库或日志数据库中直接产生的数据，存于关系数据库中，常用的数据库有，MYSQL,ORCAL,SQL SERVER,POSTGRESQL等数据库中，主要以表的形式呈现。
半结构化数据：一般我们会将半结构化的数据经过XML转化存于CLOB中，即存在XML的节点中，因此可以对数据进行有效扩展，半结构化数据一般后期会存入结构化数据库中进行调用。
非结构化数据：一般是图片，文字，语言类型通常会使用到NLP,图像处理，语音识别等技术手段进行处理之后存在nosql数据库中，常用的有mongo DB 和HBASE或者基于内存运算的列式存储Redis数据库，将数据存在数据库的节点中，优点在于能够有效扩展。