博客
关于我
HashMap 源码分析
阅读量:777 次
发布时间:2019-03-23

本文共 1991 字,大约阅读时间需要 6 分钟。

HashMap内部哈希函数与扩容机制分析

HashMap是Java中广泛使用的内存缓存,通过高效的哈希算法和数组结构实现快速的存取操作。本文将深入探讨HashMap的哈希函数设计及其扩容机制的内 lavoro原理。

为什么将哈希值的高位和低位进行异或运算?

通常情况下,哈希值的计算是通过对key的hashcode方法调用计算得出的32位整数。传统的做法是通过取模操作将该值与数组长度进行比较,以确定最终的存储位置。然而,这种方法在实际应用中可能导致较高的碰撞概率。

HashMap的设计巧妙地避免了这一问题。对传入的key,调用其hashcode()方法计算出32位的initialHash值。接着,将initialHash值高16位和低16位进行异或运算,得到最终的hash值。这一设计充分利用了位操作的特性,确保了较低的碰撞率。

哈希值异或运算的原理

通过将initialHash值的高16位和低16位进行异或运算,HashMap确保了每个哈希值的高16位和低16位都能对索引位置的选择产生影响。具体来说,对于一个32位的哈希值,高16位和低16位的组合能为索引位置提供更多的选择,显著降低了不同key占用相同索引位置的概率。

这一设计也巧妙地解决了哈希函数本身可能带来的局限性。例如,假设一个长度为8的数组,key的哈希值为78897121二进制表示为1001011001111011,经过高位和低位异或运算后,结果为0000000000000001,取模8得到的结果为1。这一计算方式确保了不同key的分布尽量均匀,避免资源浪费。

为什么选择HashMap容量是2的n次幂?

Hashmap的容量设置为2的n次幂是为了提高计算元素索引位置的效率。在计算元素存放的位置时,常用的公式为 e.hash % capacity。然而,数学模运算在计算机中效率较低,尤其是在处理大int值时。Hashmap通过位运算 e.hash & (capacity - 1) 来替代模运算,这在计算机中特别高效。

位运算与模运算的关系

从二进制角度来看,哈希值与 (capacity - 1) 进行位与运算,实际上是取哈希值的最低n位。这与哈希值对capacity取模的结果相等。例如,对于capacity=2^3=8,哈希值为x与7进行位与运算,结果就是x的最低3位。

Hashmap在扩容时,会利用这一特性将旧索引值与新索引值进行处理。这一机制的高效性来自于capacity的特殊设计,使得扩容过程的计算极为简单。

如何解决哈希碰撞问题

哈希碰撞是不可避免的,但Hashmap通过巧妙的扩容机制降低了其影响。在哈希函数计算出一个键的索引位置后,可能存在以下两种状况:

  • 索引位置为空:直接存储键值对。
  • 索引位置已存在:如果已存在的键与新键相同,则覆盖旧值;如果存在冲突,则重新组织链表或红黑树,以期减少冲突。
  • 链表转换为红黑树的条件

    为了确保哈希表性能,Hashmap允许链表转换为红黑树的条件是链表长度超过6。当链表长度超过阈值时,链表会被转换为红黑树,这一设计使得查找操作的时间复杂度从较差的O(n)提升至较好的O(logn)。

    此外,哈希碰撞发生时,通过检查链表的前后节点关系,找到最佳位置插入新节点,以保持树的平衡。

    扩容机制的实现

    Hashmap在元素数量超过指定阈值时会自动扩容。该过程包括以下步骤:

  • 计算新容量:将现有容量乘以2,不超过Integer.MAX_VALUE。
  • 重新计算阈值:根据新的容量调整负载因子。
  • 元素迁移:将旧数组中的元素按照特定规则转移至新数组,以保持查找性能。
  • 在扩容时,Hashmap确保新旧数组之间的关系,以便快速定位元素新位置。这一过程依赖于哈希函数的独特特性,利用位操作来降低计算开销。

    如何高效迁移元素?

    对于每个旧索引值e,计算其在新数组中的位置。根据哈希函数e.hash & oldCap是否为0,可以选择直接存放(若等于0)或存放在旧索引值的下一个块中(若不等于0)。

    这种设计充分利用了哈希函数的低位信息,确保在扩容时元素的定位依然高效。

    线程不安全性的表现

    尽管Hashmap在现代计算机上表现出色,但其线程不安全性仍然存在。例如,多个线程同时尝试存入同一索引位置的键值对,可能导致覆盖或逻辑错误。

    KMemo:在多核处理器环境下,更换状态的操作应进行适当的同步。然而,这并不在本文讨论的主流范围内。

    总结

    Hashmap通过巧妙的哈希函数设计和扩容机制,解决了哈希表的一时间复杂度和空间问题。这一设计充分利用了位运算和数组的结构特性,使其在实际应用中表现优异。而哈希函数的高位与低位异或运算与容量为2的n次幂的设置,正是这一优化的核心。

    通过以上分析,可以深入理解Hashmap的内部工作原理,进一步掌握Java中的数据结构应用。

    转载地址:http://jzhzk.baihongyu.com/

    你可能感兴趣的文章
    NIFI同步MySql数据_到SqlServer_错误_驱动程序无法通过使用安全套接字层(SSL)加密与SQL Server_Navicat连接SqlServer---大数据之Nifi工作笔记0047
    查看>>
    NIFI同步MySql数据源数据_到原始库hbase_同时对数据进行实时分析处理_同步到清洗库_实际操作06---大数据之Nifi工作笔记0046
    查看>>
    Nifi同步过程中报错create_time字段找不到_实际目标表和源表中没有这个字段---大数据之Nifi工作笔记0066
    查看>>
    NIFI大数据进阶_FlowFile拓扑_对FlowFile内容和属性的修改删除添加_介绍和描述_以及实际操作---大数据之Nifi工作笔记0023
    查看>>
    NIFI大数据进阶_FlowFile生成器_GenerateFlowFile处理器_ReplaceText处理器_处理器介绍_处理过程说明---大数据之Nifi工作笔记0019
    查看>>
    NIFI大数据进阶_FlowFile生成器_GenerateFlowFile处理器_ReplaceText处理器_实际操作---大数据之Nifi工作笔记0020
    查看>>
    NIFI大数据进阶_Json内容转换为Hive支持的文本格式_实际操作_02---大数据之Nifi工作笔记0032
    查看>>
    NIFI大数据进阶_Json内容转换为Hive支持的文本格式_操作方法说明_01_EvaluteJsonPath处理器---大数据之Nifi工作笔记0031
    查看>>
    NIFI大数据进阶_Kafka使用相关说明_实际操作Kafka消费者处理器_来消费kafka数据---大数据之Nifi工作笔记0037
    查看>>
    NIFI大数据进阶_Kafka使用相关说明_实际操作Kafka生产者---大数据之Nifi工作笔记0036
    查看>>
    NIFI大数据进阶_NIFI的模板和组的使用-介绍和实际操作_创建组_嵌套组_模板创建下载_导入---大数据之Nifi工作笔记0022
    查看>>
    NIFI大数据进阶_NIFI监控功能实际操作_Summary查看系统和处理器运行情况_viewDataProvenance查看_---大数据之Nifi工作笔记0026
    查看>>
    NIFI大数据进阶_NIFI监控的强大功能介绍_处理器面板_进程组面板_summary监控_data_provenance事件源---大数据之Nifi工作笔记0025
    查看>>
    NIFI大数据进阶_NIFI集群知识点_认识NIFI集群以及集群的组成部分---大数据之Nifi工作笔记0014
    查看>>
    NIFI大数据进阶_NIFI集群知识点_集群的断开_重连_退役_卸载_总结---大数据之Nifi工作笔记0018
    查看>>
    NIFI大数据进阶_使用NIFI表达式语言_来获取自定义属性中的数据_NIFI表达式使用体验---大数据之Nifi工作笔记0024
    查看>>
    NIFI大数据进阶_内嵌ZK模式集群1_搭建过程说明---大数据之Nifi工作笔记0015
    查看>>
    NIFI大数据进阶_内嵌ZK模式集群2_实际操作搭建NIFI内嵌模式集群---大数据之Nifi工作笔记0016
    查看>>
    NIFI大数据进阶_外部ZK模式集群1_实际操作搭建NIFI外部ZK模式集群---大数据之Nifi工作笔记0017
    查看>>
    NIFI大数据进阶_实时同步MySql的数据到Hive中去_可增量同步_实时监控MySql数据库变化_实际操作_03---大数据之Nifi工作笔记0035
    查看>>