所以我在这里问了另一个相关的问题:
java string hash function with avalanche effect,但我现在有一个不同的相关问题.
我在那个问题中建立的是String的hashCode()函数没有雪崩效应.这意味着,例如,如果我有字符串“k1”,“k2”,“k3”,并且我在每个上调用hashCode(),则返回的值将是连续的.
现在,基于我对数据结构101的回忆,我的印象是这是一件坏事.因为假设HashMap通过算法选择桶,例如:
class HashMap { private int capacity; private int chooseBucket(String key) { return key.hashCode() % capacity; } }
这意味着类似的密钥存储在连续的桶中,导致更高的冲突率,从O(1)降低大O查询时间到……谁知道有多糟糕……可能比O更差(log n ).
我在第一个问题中得到的答案类型是“这里不需要雪崩效应”,“它仅用于加密哈希函数”,而且“字符串的hashCode实现很快,适用于小型哈希映射”.
这让我很困惑.当它们很小时,所有数据结构都很快. Sun是否会提供一个适用于大型数据集的默认hashCode函数?那时候HashMap的表现真的很重要,不是吗?
或者,我错过了什么?请赐教.