我的应用程序通常需要使用查找来装饰它所服务的文档中的值,以获取各种代码的人类可读形式.
例如< product_code> PC001< / product_code>将要返回为< product_code code ='PC001'>小部件< / product_code> ;.它并不总是product_code;有几种不同类型的代码需要类似的行为(其中一些只有几十个例子,其中有几个是几千个). 我想知道的是将数据存储在数据库中的最有效的方法是什么?我可以想到两种可能性: 1)每个代码类型有一个文档,其中包含许多元素:
<product-codes> <product-code code = "PC001">Widgets</product-code> <product-code code = "PC002">Wodgets</product-code> <product-code code = "PC003">Wudgets</product-code> </product-codes>
2)每个代码一个文档,每个包含< product-code>元素如上.
(显然,这两个选项都包括合理的指标)
其中一个明显比另一个快吗?还有另一个更好的选择吗?
我的感觉是,一般来说,每个文档保持一个“东西”,因为它在概念上稍微更清洁,(我理解)更适合于ML的索引,但在这种情况下,似乎会导致非常大的非常小的文件.这是我应该担心的吗?