如何构建表结构以存储海量对象-属性-值关系并提高搜索效率?

如何构建表结构以存储海量对象-属性-值关系并提高搜索效率?

利用表结构存储海量对象-属性-值关系,兼顾搜索效率

问题

如何构建表结构以存储海量的对象-属性-值三元组,同时兼顾有效的搜索性能,尤其是当不同对象拥有的属性可能有所不同且数据频繁更新时?

解决方案

使用下述表结构:

讨论

  • 主表:记录三元组关系,其中:

    • rel_id:关系唯一标识符
    • obj_id:对象标识符
    • prop_id:属性标识符
    • val_type:值类型(整数、布尔值、日期等)
  • 对象描述表:描述对象
  • 属性描述表:描述属性

对于每次三元组,它将被存储在主表中,并根据值类型存储在相应的值表中。

此设计允许具有不同值的自定义属性,并使搜索效率得到优化,因为它允许通过索引对象、属性或值查找特定的三元组。

与维基数据的比较

维基数据将属性存储在 JSON 意味着每个属性都存储在单独的列中,这可能会导致搜索效率低下。而该表结构使用关系数据库,其中属性存储在单独的表中,通过主键相互关联,从而提高了搜索性能。

其他考虑

  • 如果大多数字段需要模糊查询,可以使用 Elasticsearch 等搜索引擎来完善整体功能。
  • 如果数据高度可定制,可以使用 Mongo 数据库,使用 JSON 实现。

以上就是如何构建表结构以存储海量对象-属性-值关系并提高搜索效率?的详细内容,更多请关注其它相关文章!