如何构建表结构以存储海量对象-属性-值关系并提高搜索效率?
利用表结构存储海量对象-属性-值关系,兼顾搜索效率
问题
如何构建表结构以存储海量的对象-属性-值三元组,同时兼顾有效的搜索性能,尤其是当不同对象拥有的属性可能有所不同且数据频繁更新时?
解决方案
使用下述表结构:
- 主表:rel_id int, obj_id int, prop_id int, val_type int
- 对象描述表:obj_id int, obj_desc string
- 属性描述表:prop_id int, prop_desc string
- 值表:rel_id int, val_[type] [value type]
讨论
-
主表:记录三元组关系,其中:
- rel_id:关系唯一标识符
- obj_id:对象标识符
- prop_id:属性标识符
- val_type:值类型(整数、布尔值、日期等)
- 对象描述表:描述对象
- 属性描述表:描述属性
对于每次三元组,它将被存储在主表中,并根据值类型存储在相应的值表中。
此设计允许具有不同值的自定义属性,并使搜索效率得到优化,因为它允许通过索引对象、属性或值查找特定的三元组。
与维基数据的比较
维基数据将属性存储在 JSON 意味着每个属性都存储在单独的列中,这可能会导致搜索效率低下。而该表结构使用关系数据库,其中属性存储在单独的表中,通过主键相互关联,从而提高了搜索性能。
其他考虑
- 如果大多数字段需要模糊查询,可以使用 Elasticsearch 等搜索引擎来完善整体功能。
- 如果数据高度可定制,可以使用 Mongo 数据库,使用 JSON 实现。
以上就是如何构建表结构以存储海量对象-属性-值关系并提高搜索效率?的详细内容,更多请关注其它相关文章!