- ubuntu12.04环境下使用kvm ioctl接口实现最简单的虚拟机
- Ubuntu 通过无线网络安装Ubuntu Server启动系统后连接无线网络的方法
- 在Ubuntu上搭建网桥的方法
- ubuntu 虚拟机上网方式及相关配置详解
CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.
这篇CFSDN的博客文章Go语言Elasticsearch数据清理工具思路详解由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.
微服务架构中收集通常大家都采用ELK进行日志收集,同时我们还采用了SkyWalking进行链路跟踪,而SkyWalking数据存储也用到了ES,SkyWalking每天产生大量的索引数据,如下:
WX20211008-104751@2x 。
这里一天大概产生了700左右个索引数据。对历史的链路数据我们不做过多的保留.
这里我整理了个小工具,可以定期清理es数据.
可以看到索引数据都是以日期结尾,我们可以根据日期去匹配索引数据,并对索引进行删除。这里需要考虑一点,有的Es服务开启了索引保护机制,不能通过*index去删除,只能通过索引的全名称去删除。所以我们整体流程如下:
1、获取es服务中全部索引数据.
2、根据当前时间-保留天数,获取要删除的日期.
3、通过字符串匹配,判断索引中是否包含要删除的日期,如果包含则进行删除.
4、工具友好性,我们可以通过配置文件配置ES服务地址、日期格式化类型、保留天数等信息.
要获取Es服务中全部索引数据,我们首先连接Es服务器,这里我们使用github.com/olivere/elastic/v7库操作Es.
连接ES
func GetEsClient(data Data) *elastic.Client { Init() file := "./eslog.log" logFile, _ := os.OpenFile(file, os.O_RDWR|os.O_CREATE|os.O_APPEND, 0766) client, err := elastic.NewClient( elastic.SetURL(data.Host), elastic.SetSniff(false), elastic.SetInfoLog(log.New(logFile, "ES-INFO: ", 0)), elastic.SetTraceLog(log.New(logFile, "ES-TRACE: ", 0)), elastic.SetErrorLog(log.New(logFile, "ES-ERROR: ", 0)), ) if err != nil { return nil } return client}
我们通过GetEsClient方法,连接ES,并返回client,供后续方法使用。这里的Data是包含了ES服务地址等信息,我们后面会给出Data的数据结构.
获取全部索引数据 。
func getIndex(data Data) map[string]interface{} { client := GetEsClient(data) mapping := client.GetMapping() service := mapping.Index("*") result, err := service.Do(context.Background()) if err != nil { fmt.Printf("create index failed, err: %v", err) return nil } return result}
通过client.GetMapping().Index("*")API获取es服务中全部的索引数据,并返回,数据格式如下:
WX20211008-110537@2x 。
这次我们获取全部索引完成.
我们根据当前时间-保留天数,获取当前需要删除的日期数据。我们通过GoLang内置的函数库time完成该功能的实现.
currentTime := time.Now()//获取当前时间oldTime := currentTime.AddDate(0, 0, data.Day)//通过配置文件获取保留天数format := oldTime.Format(data.IndexFmt)//通过配置文件获取序列化日期格式
这里通过字符串匹配进行判断是否需要删除索引数据.
func delIndex(data Data) { currentTime := time.Now() oldTime := currentTime.AddDate(0, 0, data.Day) format := oldTime.Format(data.IndexFmt) index := getIndex(data)//获取全部索引 for k := range index {//遍历索引数据 fmt.Println("key:", k, "format:", format) if find := strings.Contains(k, format); find { //判断索引中是否包含要删除的日期格式, DelIndex(data, k)//如果包含则调用DelIndex方法删除 } }}
// DelIndex 删除 indexfunc DelIndex(data Data, index ...string) bool { client := GetEsClient(data) response, err := client.DeleteIndex(index...).Do(context.Background()) if err != nil { fmt.Printf("delete index failed, err: %v", err) return false } return response.Acknowledged}
通过DeleteIndexAPI删除指定的数据.
这里我们定义了Config和Data对象,对象结构如下:
type Config struct { Data []Data `json:"data"`} type Data struct { Host string `json:"host"` IndexFmt string `json:"index_fmt"` Day int `json:"day"`}
配置文件内容如下:
{ "data": [ { "host": "http://ip1:9200",//服务IP "index_fmt": "20060102",//日期格式化 "day": -1 //保留天数 保留1天 }, { "host": "http://ip2:9200/", "index_fmt": "20060102", "day": -1 }, { "host": "http://ip3:32093", "index_fmt": "2006.01.02", "day": -7 //保留天数 保留7天 } ]}
我们通过Init方法加载配置文件到Config,
var config Config func Init() { JsonParse := NewJsonStruct() //下面使用的是相对路径,config.json文件和main.go文件处于同一目录下 JsonParse.Load("config/config.json", &config)} type JsonStruct struct {} func NewJsonStruct() *JsonStruct { return &JsonStruct{}} func (jst *JsonStruct) Load(filename string, v interface{}) { //ReadFile函数会读取文件的全部内容,并将结果以[]byte类型返回 data, err := ioutil.ReadFile(filename) if err != nil { return } //读取的数据为json格式,需要进行解码 err = json.Unmarshal(data, v) if err != nil { return }}
编写Main方法运行程序:
func main() { Init() for i, datum := range config.Data { fmt.Printf("config data Host is [%s], fmt is [%s]", datum.Host, datum.IndexFmt) println(i) delIndex(datum) }}
这里我们依然遍历配置文件中的多个服务配置。可以同时管理多个Es服务.
package main import ( "encoding/json" "fmt" "io/ioutil" "strings" "time") type Config struct { Data []Data `json:"data"`} type Data struct { Host string `json:"host"` IndexFmt string `json:"index_fmt"` Day int `json:"day"`} var config Config func Init() { JsonParse := NewJsonStruct() //下面使用的是相对路径,config.json文件和main.go文件处于同一目录下 JsonParse.Load("config/config.json", &config)} type JsonStruct struct {} func NewJsonStruct() *JsonStruct { return &JsonStruct{}} func (jst *JsonStruct) Load(filename string, v interface{}) { //ReadFile函数会读取文件的全部内容,并将结果以[]byte类型返回 data, err := ioutil.ReadFile(filename) if err != nil { return } //读取的数据为json格式,需要进行解码 err = json.Unmarshal(data, v) if err != nil { return }} func delIndex(data Data) { currentTime := time.Now() oldTime := currentTime.AddDate(0, 0, data.Day) format := oldTime.Format(data.IndexFmt) index := getIndex(data) for k := range index { fmt.Println("key:", k, "format:", format) if find := strings.Contains(k, format); find { DelIndex(data, k) } }} func main() { Init() for i, datum := range config.Data { fmt.Printf("config data Host is [%s], fmt is [%s]", datum.Host, datum.IndexFmt) println(i) delIndex(datum) }}
package main import ( "context" "fmt" "github.com/olivere/elastic/v7" "log" "os" "time") // GetEsClient 初始化客户端func GetEsClient(data Data) *elastic.Client { Init() file := "./eslog.log" logFile, _ := os.OpenFile(file, os.O_RDWR|os.O_CREATE|os.O_APPEND, 0766) // 应该判断error,此处简略 client, err := elastic.NewClient( elastic.SetURL(data.Host), elastic.SetSniff(false), elastic.SetInfoLog(log.New(logFile, "ES-INFO: ", 0)), elastic.SetTraceLog(log.New(logFile, "ES-TRACE: ", 0)), elastic.SetErrorLog(log.New(logFile, "ES-ERROR: ", 0)), ) if err != nil { return nil } return client} // IsDocExists 判断索引是否存储func IsDocExists(data Data, id string, index string) bool { client := GetEsClient(data) defer client.Stop() exist, _ := client.Exists().Index(index).Id(id).Do(context.Background()) if !exist { log.Println("ID may be incorrect! ", id) return false } return true} // PingNode 是否联通func PingNode(data Data) { start := time.Now() client := GetEsClient(data) info, code, err := client.Ping(data.Host).Do(context.Background()) if err != nil { fmt.Printf("ping es failed, err: %v", err) } duration := time.Since(start) fmt.Printf("cost time: %v", duration) fmt.Printf("Elasticsearch returned with code %d and version %s", code, info.Version.Number)} // GetDoc 获取文档func GetDoc(data Data, id string, index string) (*elastic.GetResult, error) { client := GetEsClient(data) defer client.Stop() if !IsDocExists(data, id, index) { return nil, fmt.Errorf("id不存在") } esResponse, err := client.Get().Index(index).Id(id).Do(context.Background()) if err != nil { return nil, err } return esResponse, nil} // CreateIndex 创建 indexfunc CreateIndex(data Data, index, mapping string) bool { client := GetEsClient(data) result, err := client.CreateIndex(index).BodyString(mapping).Do(context.Background()) if err != nil { fmt.Printf("create index failed, err: %v", err) return false } return result.Acknowledged} // DelIndex 删除 indexfunc DelIndex(data Data, index ...string) bool { client := GetEsClient(data) response, err := client.DeleteIndex(index...).Do(context.Background()) if err != nil { fmt.Printf("delete index failed, err: %v", err) return false } return response.Acknowledged} func getIndex(data Data) map[string]interface{} { client := GetEsClient(data) mapping := client.GetMapping() service := mapping.Index("*") result, err := service.Do(context.Background()) if err != nil { fmt.Printf("create index failed, err: %v", err) return nil } return result}
代码已经上传github需要的可自行下载.
到此这篇关于Go语言Elasticsearch数据清理工具的文章就介绍到这了,更多相关Go Elasticsearch数据清理工具内容请搜索我以前的文章或继续浏览下面的相关文章希望大家以后多多支持我! 。
原文链接:https://blog.csdn.net/July_whj/article/details/120648785 。
最后此篇关于Go语言Elasticsearch数据清理工具思路详解的文章就讲到这里了,如果你想了解更多关于Go语言Elasticsearch数据清理工具思路详解的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。
这个问题在这里已经有了答案: Android ADT version required 20.0.0 and above (10 个答案) 关闭 9 年前。 我刚刚安装了 Eclipse Juno
按照 This page from codeplex 上的指南进行操作后,我无法在我的工具/选项窗口中看到 Python 选项。我认为我与指南的唯一偏差是: 发行版:没有安装 activestate
我有一个非常大的 .sql 脚本。我将此脚本添加到 Visual Studio 2013 下的 SQL Server 项目中。当我尝试构建它时,我收到此错误消息 This T-SQL script e
当我在SpringBoot项目中想加个依赖,但是不确定现有依赖的依赖的依赖.....有没有添加过这个依赖,怎么办呢?如果添加过了但是不知道我需要的这个依赖属于哪个依赖的下面,怎么查呢? IDEA中提供
我正在做一个项目来减少 PDF 的大小,压缩它们。我想知道市场上是否有任何非常好的工具/库(.NET)。 我确实尝试了一些像 Onstream Compression 这样的工具,但结果并不令人满意。
我想从我的源代码编译一个安卓内核。 但我想使用工具或类似的东西。 所以我只需单击一个按钮并获得一个可闪存的 zip 文件... 有工具吗? 我可以用脚本来做吗? 谢谢! 最佳答案 这取决于您从哪里获得
我们生成 pdf 文件,其中包含有关数万名客户每月财务余额的数据。在高峰期(年底有 100.000 个文件),使用在 5 台服务器之间分配负载,该过程可能需要长达 5 天的时间才能完成。工作负载的分配
模块:xmllib xmllib 是一个非验证的低级语法分析器。应用程序员使用的 xmllib 可以覆盖 XMLParser 类,并提供处理文档元素(如特定或类属标记,或字符实体)的方法。从 Py
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。 关闭 3 年前。
我在一家医疗保健公司工作,拥有有关患者位置(地址、城市、州、 zip )的信息。我试图确定有多少百分比的患者住在离 5 个特定位置最近的地方。我正在寻找的答案是“25% 的患者住在离#1 地点最近的地
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 4年前关闭。 我们不允许在 Stack Overflow 上提出有关通用计算硬件和软件的问题。您可以编辑问
As it currently stands, this question is not a good fit for our Q&A format. We expect answers to be
请问我在哪里可以得到 SvcTraceViewer 工具? 我尝试下载并安装许多 SDK。 我查看了程序文件的垃圾箱。 我需要它来跟踪我的 WCF 调用出了什么问题。 最佳答案 您可以通过下载 Win
我正在尝试在我最喜欢的编辑器中设置适当的代码完成功能,我们将其称为AnEditor,以避免互联网上充斥着特定于程序的答案。 (您知道语言是ALanguage。)编辑器具有两个我喜欢的功能:它既可以在控
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the he
当 merge 的两个分支对同一文件有更改时,Mercurial 是否总是使用外部 merge 工具? 或者它是否首先查看它是否可以 merge 文件本身,如果不能,则仅转向外部工具? 我问的原因是我
我正在为我使用的编辑器编写 Scala 插件,该插件将突出显示所有未使用的代码路径(可能未使用 defs 、 vals 、 classes 和 implicits ),并为用户提供一个选项以将它们从.
我有 jquery 工具滚动器...我喜欢它只为 swipeLeft swipeRight 实现触摸选项。 当我使用 touch: true 时,它也会在向上/向下滑动时旋转.. 我按照此处的说明
我已经尝试了一些用于构建 UML(对象/依赖图)的 Eclipse 工具,但我真正需要的是一个工具来生成这样的代码外 UML。 (反之亦然) 我更喜欢一个简单的 UML 工具,它易于安装并且没有任何依
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的,因为
我是一名优秀的程序员,十分优秀!