Presto in Action 1 2021-06-02 bigdata 1253 words 3 mins read [TOC] 前言 公司因为架构调整,需要进行数据的实时加载。原本的方案是直接通过客户端查询索引,同时通过索引返回的id查询详情,整个流程比较复杂,并且其 Read more...
Gradle Docker Action 1 2021-05-14 gradle 342 words 1 min read 场景 因为最近在转用Gradle进行项目的编译,所以很多以前用maven的地方,还是有非常多的不同。这里主要针对Docker的使用,来进行记录 Read more...
Gradle 使用 buildSrc 2021-04-21 gradle 3555 words 8 mins read [TOC] 前言 最近在学习如何使用gradle,原本都是使用maven的,但随着gradle的广泛使用,开源项目基本上都改为gradle了。之前就碰到 Read more...
Linux 下文本抽取统计及对比 2021-04-19 linux 1232 words 3 mins read 场景 现在有两个词典,一个 1600万,一个 200万,里面的格式分别为: 1 2 3 4 5 1600万的格式: 101团 nr 0 200万的格式: 179 FC经理 x 0 领 Read more...
使用 FST 做分词器 2021-04-14 lucene 3471 words 7 mins read 场景 在分词器的使用中,主要就是字典如何构建,能够达到空间和时间的最优化,常用的字典数据结构: 数据结构 优缺点 排序列表Array/List 使用二 Read more...