Python连接es笔记二之查询方式汇总

阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6

本文首发于公众号:Hunter后端

原文链接:Python连接es笔记二之查询方式汇总

上一节除了介绍使用 Python 连接 es,还有最简单的 query() 方法,这一节介绍一下几种其他的查询方式。

以下是本篇笔记目录:

  1. query() 方法介绍
  2. Q() 查询
  3. 排序
  4. 分页
  5. source() 指定返回字段
  6. extra() 操作
  7. count() 总数
  8. from_dict() 函数

1、query() 方法介绍

在上一节中介绍了 query() 的一个简单示例,如下:

s = Search(using="default").index("exam")

s = s.query("match", name="张三丰")

query() 中接受两个参数,第一个是字段查询的方式,比如这里是 match,也可以是 term,这个依照查询的目的来替换。

第二个则是查询的字段与值,比如这里是查询的 name 字段为 "张三丰" 的数据。

如果是有多个条件,比如 name="张三丰",address="中国" 的数据,这里的 = ,并非是完全等于的意思,而是会依照前面的查询方式,比如 match 或 term 进行类似的分词或者模糊搜索。

如果是上面多个条件的查询,可以直接在后面加上类似的 query():

s = s.query("match", name="张三丰").query("match", address="中国")

这两个 query() 通过链式操作连在一起转换成 es 语句就是使用 must 将多条件连接在一起,我们可以使用 to_dict() 方式来查看:

s.to_dict()

# {'query': {'bool': {'must': [{'match': {'name': '张三丰'}}, {'match': {'address': '中国'}}]}}}

2、Q() 查询

如果看过之前我写过的 Django 系列笔记,应该记得在 Django 里也有个 Q() 方法的查询,和这里的一样,也是用于条件的联合,与或非条件都可以实现。

引入方式如下:

from elasticsearch_dsl import Q

但是如果是在 Django 中使用 es 的连接,也是同样使用 Q() 方法,我们可以使用 as 来区分,这里我们对于 es 的 Q() 方法可以使用 ES_Q() 来区分:

from elasticsearch_dsl import Q as ES_Q

单个条件的使用 Q() 如下:

s = s.query(ES_Q("match", name="张三丰"))

如下使用 dict 形式的操作也是等效的:

s = s.query(ES_Q({"match": {"name": "张三丰"}}))

与操作

对于这两个条件,如果想要实现它们的与操作:

q1 = ES_Q("match", name="张三丰")
q2 = ES_Q("match", address="中国")

可以如下实现:

s = s.query(q1 & q2)

或操作

如果是想实现上面的或操作,可以如下:

s = s.query(q1 | q2)

非操作

如果是想取反,直接在条件前加一个 ~ 即可:

q1 = ~ES_Q("match", name="张三丰")
s = s.query(q1)

multi_match

如果是搜索多字段,可以如下操作:

q = ES_Q("multi_match", query="中国 张三丰", fields=["name", "address"])

s = s.query(q)

text.keyword 操作

对于 es 中 text 字段,前面我们介绍过 .keyword 的查询方式,是将 text 字段作为一个整体进行查询,在 ES_Q() 中,以下两种操作是等效的:

q = ES_Q({"term": {"address.keyword": "中国湖北省"}})

q = ES_Q("term", address__keyword="中国湖北省")

filter() 操作

在 es 中的 filter 操作,在 Python 中是一个 filter() 函数,可以直接使用:

q = ES_Q("term", name="张三丰")
s = s.filter(q)

range 操作

实现大小于的操作示例如下:

q = ES_Q({"range": {"age": {"gte": 21}}})
s = s.query(q)

exclude() 操作

如果是想取反,除了使用 ~Q(),还可以直接使用 exclude() 函数,这个和 Django 里的操作也是一样的:

q = ES_Q("term", name="张三丰")
s = s.exclude(q)

3、排序

如果是想对返回的结果进行排序操作,直接使用 .sort() 方法。

比如想对 age 字段排序,正序返回数据,可如下操作:

s = s.sort("age")

如果是想倒序返回,可以如下操作:

s = s.sort("-age")

多字段排序直接在后面跟上就行:

s = s.sort("-age", "name")

4、分页

Python 连接 es 进行分页,可以直接使用 Python 里的切片操作,比如:

s = s[5:10]

5、source() 指定返回字段

我们可以通过 source() 方法指定返回的字段:

s = s.source(["name", "address"])

source() 方法还可以接受 includes 和 excludes 参数来指定返回的字段或者不返回的字段,这个和 es 的原生处理方式是一致的:

s = s.source(
includes=["address"],
excludes=["name"]
)

6、extra() 操作

extra() 函数接受一些查询的额外属性,比如 size 参数决定返回条数,比如 from 参数可以决定从第几条数据开始返回,sort 参数决定排序方式,以及 _source 参数决定返回的字段。

比如我们想要返回的数据从第 2 条数据开始,返回两条,按照 name 字段进行排序,只返回 name 和 _id 字段,可以如下操作:

s = Search(using="default").index("exam")
s = s.extra(
sort="name",
_source=["name"],
**{
"from": 1,
"size": 2
}
)
response = s.execute()

7、count() 总数

前面介绍过获取符合条件的总数,可以通过 response.hits.total.value 的方式获得,其实对于 Search(),可以直接使用 count() 函数:

count = s.count()

8、from_dict() 函数

如果我们想直接运行 kibana 里执行的命令,可以使用 from_dict() 函数,比如:

s = s.from_dict(
{
"query": {
"term": {
"name": {
"value": "张三丰"
}
}
}
}
)

如果想获取更多后端相关文章,可扫码关注阅读:

阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6
标签: python

“Python连接es笔记二之查询方式汇总” 的相关文章

python爬虫的学习总结

背景 基于django框架完成jira网页数据的爬取。由于对爬虫知识知道的太少,我开始了新的学习之旅。本文前半部分都是记录这一周主要的错误,如果想直接看最终成果,可以跳到本文“成功爬取”部分浏览。 学习爬虫知识 在知道了本项目可能需要爬虫后࿰...

10/29/2017

1、 用标准C编程:找出整形数字1-100之间的素数,并打印出来。(素数:除了1和自己本身可以被整除。) 2、 用标准C编程:有两个整形变量m、n,求出这两个数的最小公倍数。 3、 用标准C编程:输出杨辉三角形的前10行:三角形的每一行是(x+y)^n的展开式各项的系数。 例如: 第一行是(...

php报错“ocienvcreate”如何解决 - 编程语言

今天小编给大家分享一下php报错“ocienvcreate”如何解决的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。 一、什么...

php怎么将字符串转换为数组和对象数组 - 编程语言

这篇文章主要讲解了“php怎么将字符串转换为数组和对象数组”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“php怎么将字符串转换为数组和对象数组”吧! 一、将字符串转换为数组使用PHP的内置函...

2023浙江省赛“信息安全管理与评估“--Reverse部分全部解析(高职组)

2022全国职业技能大赛“信息安全管理与评估”(高职组)任务书 2022全国职业技能大赛“信息安全管理与评估”任务书 第一阶段竞赛项目试题 第二阶段竞赛项目试题 第三阶段竞赛项目试题...

怎么用Python获取和存储时间序列数据 - 编程语言

今天小编给大家分享一下怎么用Python获取和存储时间序列数据的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。 要求本教程在通...