“BB书屋”最新网址:https://www.bbwwljj.com,请您添加收藏以便访问
当前位置:BB书屋 > 其他类型 > 离语 > 第357章 哇塞

第357章 哇塞(2 / 2)

上一页 章节列表 下一章
好书推荐: 行商坐医 大明,从带朱元璋逛紫禁城开始 带着刘天仙去影视世界 混沌天帝诀楚剑秋柳天瑶 全职法师,我的世界双穿门 至尊龙魂 叶罗丽之水默勿忘 鉴宝天眼:我在都市捡漏成首富 官道雄才 庶女高嫁

时间戳字段就会被修改为相应的系统时间y自增长字段就会增加每当etl工具进行增量数据获取时y只需比对最近一次数据抽取的增量字段值y就能判断出来哪些是新增数据y哪些是修改数据。这种数据抽取方式的优点是抽取性能比较高y判断过程比较简单yetl系统设计清晰y源数据抽取相对清楚简单y可以实现数据的递增加载最大的局限性就是由于某些数据库在进行设计的时候y未考虑到增量字段y需要对业务系统进行改造y基于数据库其他方面的原因y还有可能出现漏数据的情况。3.全量同步全量同步又叫全表删除插入方式y是指每次抽取前先删除目标表数据y抽取时全新加载数据该方式实际上将增量抽取等同于全量抽取对于数据量不大y全量抽取的时间代价小于执行增量抽取的算法和条件代价时y可以采用该方式。这种方式的优点是对已有系统表结构不产生影响y不需要修改业务操作程序y所有抽取规则由etl完成y管理维护统一y可以实现数据的递增加载y没有风险缺点是etl比对较复杂y设计较为复杂y速度较慢与触发器和时间戳方式中的主动通知不同y全表比对方式是被动的进行全表数据的比对y性能较差当表中没有主键或唯一列且含有重复记录时y全表比对方式的准确性较差。日志比对的方式是通过获取数据库层面的日志来捕获到变化的数据y不需要改变源业务系统数据库相关表结构y数据同步的效率比较高y同步的及时性也比较快y最大的问题就是不同数据库的日志文件结构存在较大的差异性y实施分析起来难度比较大y同时y需要具备访问源业务库日志表文件的权限y存在一定的风险性y所以这种方式有很大的局限性。日志比对方式中比较成熟的技术是cdc(gedatacapture)技术y作用同样是能够捕获到上一次抽取之后产生的相关变化数据y当cdc对源业务表进行新增更新和删除等相关操作的时就可以捕获到相关变化的数据y相对于增量字段方式ycdc方式能够较好地捕获到删除数据y并写入相关数据库日志表y然后再通过视图或者别的某种可操作的方式将捕获到的变化同步到数据仓库当中去。这种方式的优点是etl同步效率较高y不需要修改业务系统表结构y可以实现数据的递增加载缺点是业务系统数据库版本与产品不统一y难以统一实现y实现过程相对复杂y并且需深入研究方能实现这种方式也通过第三方工具实现y但是y一般都是商业软件y费用较高。

温馨提示:亲爱的读者,为了避免丢失和转马,请勿依赖搜索访问,建议你收藏【BB书屋网】 www.bbwwljj.com。我们将持续为您更新!

请勿开启浏览器阅读模式,可能将导致章节内容缺失及无法阅读下一章。

上一页 章节列表 下一章
新书推荐: 重生后,这恶毒女配我不当了 新婚出轨?商界女王她要整顿夫家 科学算命,我在娱乐圈杀疯了 凡仙路 乖美人装乖,偏惹偏执狂失控 武侠:都修仙了,谁还去论剑啊 她抢婚成替嫁,帝国财阀一夜沦陷 外人说大哥糙,可他夜里喊我娇娇 医妃替嫁,清冷残王站起来了 冤枉!我真没勾引阴湿疯批弟弟对我强制爱啊