楼盘字典为什么能成为贝壳的超级护城河?

昨天给大家分享了一下数字化转型的三种主导方式:产品主导、技术主导和业务主导。其中不免又把贝壳的案例拿出来分析。结束之后,一位朋友现场提问,为什么楼盘字典能够成为贝壳的护城河呢?当场解释之后,这位朋友还追到休息室聊了半个多小时,应该是嫌弃我没说明白。

我向来不是一个急智的人,但凡遇到一个问题都得整理清楚思路之后才能完整回答。不过这个问题还真值得写一篇好好说说的。

一、啥是楼盘字典?

楼盘字典如字面意思,就是一本写满了楼盘信息的字典。贝壳的楼盘字典采用的是7级门址:城市、城区、楼盘、楼幢、单元、楼层、房屋,这样就能确定每一套房,然后再给这套房编一个独一无二的代码。这样再加精准GPS坐标,就能确定每一套房的地理位置。

图片来源于贝壳公开演讲资料

同时,他们还会收集每一套房的商圈、楼盘别名、行政地址、产权地址、邮编、房间信息、周边设施等基本信息。

还会收集总建筑面积、会所名称、地上车位、总占地面积、所属街道、居住总户、电梯品牌、绿化率、门窗材质、容积率、物业名称、大堂装饰、建筑类型、通信配置、外墙面、建筑结构、供水方式、建成年代、开发商名称、供电方式、开盘均价、供气公司名称、供气方式、采暖方式、供暖公司名称、自来水公司名称、土地级别、物业公司、社区安全配备、地上车位数、地下车位数、入住时间、最低计税价、付赠面积、公摊面积、项目文章、车位数量、容积率、项目位置图、项目交通图、整体规划图、生活信息图、外观实景图、楼栋位置图、楼盘剖面图、原始户型图、消防疏散图等扩展信息!

我都不说别的,光这些名词我一口气就念不完呐。贝壳楼盘字典现在一共建了多少呢?2亿多套!

产品经理,产品经理网站

图片来源于贝壳公开演讲资料

二、楼盘字典有啥用?

有啥用?这么说吧,楼盘字典是链家升级贝壳的核心中的核心。现在都说ACN是贝壳的核心,我们来捋一下哈,ACN是这样的;

ACN把卖房的流程拆分成两个方向10个小流程。每个角色完成一部分的工作,就拿这部分该拿的钱。

我们假设一下,如果没有这个楼盘字典,你怎么把这个流程串起来?甲完成了找一个房源,录到系统中,乙完成了这个房源勘探,也录到系统中,结果系统中是两条数据,怎么给他们算功劳?谁说的清啊?更不用说后续的卖房的事儿。到系统里一搜,同一个房源有N条信息,而且时间还不一样,信息冲突,房主都买过两轮了,还能找到第一个房子的电话,这不乱套了么?

现在很多平台上就是这种情况啊。早期的二手房平台,都用爬虫技术互相爬取,你爬我的,我爬你的,乱成一锅粥。再加上卖房小哥防止别人抢自己好不容易找到的一手信息,故意放的错误信息,你说这房源信息能真的了么?

政府三令五申,禁止房地产交易平台上传虚假房源信息,这人性的弱点,哪能是一纸政令就能搞定的?但是楼盘字典就保证了数据的统一性、唯一性和准确性。

这个统一的丰富的楼盘字典,就是贝壳扎实的数据基础,对所有业务提供基础数据服务。比如各种花式查询、精准导航、BIM快速出图等,结合大数据和算法,还能有各种的楼盘数据分析、热卖小区、户型图解、估价、成交预测等等高阶数据服务。你说这楼盘字典有多有用!

楼盘数据是怎么收集来的?无他,人肉尔!

我在网上找到的信息是从2008年开始建设楼盘字典,2011年制定了真房源标准。但是我从一份早期的《楼盘字典采集系统培训手册.ppt》上看到,该文档是2005年创建的,2009年最后一次保存。

图片来源于贝壳公开资料

那么我理解,应该是从2008年开始建设楼盘字典的系统,2009年开始进行全面采集。咋采集?业务员扫楼呗!

当时链家的经纪管理部成立了楼盘字典项目组,利用楼盘字典采集系统采集所有楼盘数据。采集范围是所有能出售/出租的房屋。

他们以大区为最高管理单位,大区下面是区域,再往下是店面作业单位。一层层落实到位,管理到位。同时每个区域配备一名普查员,负责房源的真实性、完整性,以及楼盘数据录入的进度监督、控制和检查工作。

就这样,从2008年到现在,持续12年了。累计投入多少钱呢?2017年的时候就号称已经投入4.5个亿了。用了多少人呢?人数最多的时候是在2014年,雇了500多名兼职人员搞定了24个城市的6000万套房源。

你说要是没用,不能成为核心数据资产,链家能这么投入么?

三、楼盘字典系统怎么建设的?

这可是人家的商业秘密!不过我倒是真做过类似的工作,当年我做过朝阳区地址库。另外,之前服务过的国家统计局的人口普查(民用住宅)、经济普查(商用房产)系统中,地址也是核心中的核心呐!

楼盘字典中各种乱七八糟的系统功能设计其实很简单,就是一个信息录入的页面,没啥难度的。无非就是按照录入业务流程,给个页面,把所有字段都放进去,让业务员好填写,然后上级检查,普查员抽查,领导监督进度。页面长这个德行:

图片来源于贝壳公开资料

至于楼盘字典的数据库,大致是这个样子:

图片来源于百度

所有数据的基础是GIS,所以必须得有一个GIS数据库;然后就是房源数据库,里面全是各种小区、房源的信息;还有地址库,我之前做的就是这个工作,把乱七八糟的地址给稍微统一一下;还有历史数据和管理数据等等。

主要的功能呢,基本上就是数据采集(业务员用)、采集进度管理(管理层用)、数据质量管理(普查员用)、元数据管理(初始化用)、系统管理(管理员用)等。

这毕竟还是一个OLTP的系统,又是内部人员用,所以长的丑点无所谓了,主要是能把数据沉淀下来啊。

四、没有楼盘字典怎么办?

其实一直以来,都有人拿美国的MLS说事,说中国无能,不团结,做不起来这种完全开放且数据真实的房地产信息平台。

这个言论其实很没道理,单纯的对比而已。美国为啥能有MLS?因为美国地广人稀,僧多粥少,而且也有飞单到其他公司的情况,所以各经纪公司就制定了MLS规则,抱团取暖,成立了MLS。而且,美国的MLS也不是全国统一的,各地都有,据统计有800多个。所以贝壳其实就是中国改良版的MLS。

那对于其他经纪公司来说,没有贝壳那样的楼盘字典咋办?好办么,弄一个就是了。贝壳是半封闭的,接受ACN规则的经济公司,才对他开放所有资源。想要打败贝壳,那只有出现一种更开放、更完善的规则。因为在贝壳目前的维度之下,没有敌手。ACN就是二向箔,低维度的商业模式根本无法抵抗。

咱圈外人,看个热闹就行了。这些事情地产界的人研究的透透的,潘石屹大佬的弟弟潘石坚就写过很多MLS的科普文章,各位可以去翻一翻。瓜吃完了,下次再聊~~

 

作者:大数据架构师,国药国华大数据总监,擅长BI、数仓、数据中台产品规划领域,公众号:大数据架构师

本文作者 @大数据架构师

版权声明

本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部