Neo4j安装+Python操作Neo4j

一、Neo4j安装及服务启动

Neo4j是目前最流行的图形数据库,支持完整的事务,图形数据库也就意味着它的数据并非保存在表或集合中,而是保存为顶点以及顶点之间的关系。图是由顶点(Vertex),边(Edge)和属性(Property)组成的,顶点和边都可以设置属性,顶点也称作顶点,边也称作关系,每个顶点和关系都可以有一个或多个属性。

1、Neo4j安装

[Windows平台安装] (https://www.cnblogs.com/ljhdo/archive/2017/05/19/5521577.html)
[Linux平台安装] (https://blog.csdn.net/qq_21383435/article/details/79557819)

2、启动配置

Neo4j应用程序有如下主要的目录结构:

1
2
3
4
5
6
7
8
9
10
11
12
bin/ -->Neo4j可执行程序
cypher-shell --> 操作Cypher的程序
neo4j --> 服务端程序
neo4j-admin -->管理工具,设置命令,数据恢复等功能。
neo4j-backup -->热备份工具(只有企业版支持)
neo4j-import -->数据导入导出工具
conf/ -->配置文件目录
neo4j.conf -->控制Neo4j启动的配置文件
data/ -->数据库文件目录
databases/
graph.db -->核心数据库文件
plugins/ -->Neo4j的插件

neo4j.conf的常用配置参数如下

参数 描述
-dbms.active_database 数据库名字,默认graph.db
-dbms.directories.data 数据库路径(会自动补上databases)
-dbms.memory.heap.initial_size jvm初始堆内存
-dbms.memory.heap.max_size jvm最大堆内存
-dbms.memory.pagecache.size 类似缓存,越大越好
-dbms.connectors.default_listen_address 可以远程访问neo4j数据库的ip,0.0.0.0表示不限制

配置介绍
端口和日志介绍

3、服务开启与关闭

(1)Windows下配置
使用WIN+R运行cmd命令执行进入bin目录下执行

1
2
neo4j install-service  # 安装为服务
neo4j uninstall-service # 卸载服务

执行如下命令开启、关闭、重启、状态查询

1
2
3
4
neo4j start
neo4j stop
neo4j restart
neo4j status

(2)Linux下配置
进入安装目录下,执行如下命令开启、关闭、重启、状态查询

1
2
3
4
neo4j start
neo4j stop
neo4j restart
neo4j status

4、打开Neo4j集成的浏览器

Neo4j服务器具有一个集成的浏览器,在一个运行的服务器实例上访问 “http://localhost:7474/ “,打开浏览器,显示启动页面
默认的用户是neo4j,其默认的密码是:neo4j,第一次成功登陆到Neo4j服务器之后,需要重置密码。

二、py2neo安装

py2neo 是用来对接 Neo4j的 Python 库

1
pip install py2neo

官方文档

三、使用py2neo操作neo4j数据库

连接neo4j数据库

1
2
3
4
from py2neo import Graph,Node,Relationship

# 连接neo4j数据库,输入地址、用户名、密码
graph = Graph('http://localhost:7474', username='neo4j', password='test')

1、创建顶点和关系

创建了两个Node以及两者之间的Relationship。在这里有必要提一下,如果建立关系的时候,起始顶点或者结束顶点不存在,则在建立关系的同时建立这个顶点。

1
2
3
4
5
6
7
8
9
# 可以一个一个创建
a = Node('Person',name='bubu')
a['age'] = 18 # 给Node赋属性
del a['age'] # 删除Node属性
graph.create(a)
b = Node('Person',name='kaka')
graph.create(b)
r = Relationship(a,'KNOWS',b)
graph.create(r)

可以通过 setdefault() 方法赋值默认属性(当给location赋值了属性,则它会把默认的属性覆盖)

1
2
c = Node('City')
c.setdefault('location', '北京')

2、更新顶点和关系

1
2
a.update(age=22, sex='female')
ab.update(time='2019/09/03')

3、删除顶点和关系

1
2
graph.delete(a)  # 删除顶点
graph.separate(ab) # 删除关系

4、创建subgraph对象

由顶点和关系组成的集合就是子图(subgraph),定义子图的关系运算符包括求交集&、并集|、差集-、对称差集^。
subgraph.labels返回子图中所有标签集合,keys()返回所有属性集合,nodes返回所有顶点集,relationships返回所有关系集

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
a = Node("Person", name="Alice")
b = Node("Person", name="Bob")
ab = Relationship(a, "KNOWS", b)

c = Node("Person", name="Carol")
ac = Relationship(a, "WorksWith", c)

# 集合操作是创建子图最简便的方法
s = ab | ac
# 对图中的所有顶点集合进行遍历
for item in s.nodes:
print('s的顶点:', item)

# 创建子图s
graph.create(s)
# 删除子图s
graph.delete(s)

5、创建walkable对象

walkable是在子图subgraph的基础上增加了遍历信息的对象,通过它可以便捷地遍历图数据库。
通过+号将关系连接起来就构成了一个walkable对象,通过walk()函数对其进行遍历,可以利用start_node、end_node、nodes、relationships属性来获取起始Node、终止Node、所有Node和Relationship。

1
2
3
4
5
6
7
8
9
10
11
# 组合成一个walkable对象w
w = ab + bc + ac
# 对w进行遍历
for item in walk(w):
print(item)

# 访问w的初始、终止顶点
print('起始顶点:', w.start_node, ' 终止顶点:', w.end_node)
# 访问w的所有顶点、关系列表
print('顶点列表:', w.nodes)
print('关系列表:', w.relationships)

6、创建路径

1
2
w = ab + Relationship(b, "LIKES", c) + ac
graph.create(w)

7、查询顶点

如果要查询单个顶点的话,可以使用first()方法

1
2
3
4
5
from py2neo import NodeMatcher

matcher = NodeMatcher(graph)
matcher.match("Person", name="Kevin").first()
matcher.match("Person", name__not="Rick Astley").first()
描述 后缀 示例
表达相等 __exact matcher.match(“Person”, name__exact=”Kevin Bacon”)
表达不相等 __not matcher.match(“Person”, name__not=”Rick Astley”)
表达大于 __gt matcher.match(“Person”, born__gt=1985)
表达大于等于 __gte matcher.match(“Person”, born__gte=1965)
表达小于 __lt matcher.match(“Person”, born__lt=1965)
表达小于等于 __lte matcher.match(“Person”, born__lte=1965)
以XX开头 __startswith matcher.match(“Person”, name__startswith=”Kevin”)
以XX结尾 __endswith matcher.match(“Person”, name__endswith=”Smith”)
包含关系 __contains matcher.match(“Person”, name__contains=”James”)

8、查询关系

1
2
3
4
5
6
7
8
9
10
11
from py2neo import NodeMatcher, RelationshipMatcher

graph = Graph('http://localhost:7474', username='neo4j', password='test')
node_matcher = NodeMatcher(graph)
relationship_matcher = RelationshipMatcher(graph)

a = node_matcher.match("city", name__startswith="s").first()
b = node_matcher.match("city", name__startswith="b").first()
relList = list(relationship_matcher.match(nodes=(b, a), r_type="to"))
for i in relList:
print(i)

9、执行CQL语句

CQL代表Cypher查询语言,是Neo4j图形数据库的查询语言。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
from py2neo import Graph

# 连接neo4j数据库,输入地址、用户名、密码
graph = Graph('http://localhost:7474', username='neo4j', password='test')

# CQL查询
graph.run("MATCH (n:Person) RETURN n LIMIT 25").data() # list型
graph.run("MATCH (n:Person) RETURN n.name, n.age LIMIT 25").data()
graph.run("MATCH (n:Person) RETURN n LIMIT 25").to_data_frame() # dataframe型
graph.run("MATCH (n:Person) RETURN n LIMIT 25").to_table() # table

cursor = graph.run("MATCH (n:Person) RETURN n LIMIT 25")
# 循环向前移动游标
while cursor.forward():
# 获取并打印当前的结果集
record = cursor.current
print(record)

附录
CQL查询语言
py2neo官方文档
py2neo操作整理

0%