hash

hash 表的创建

字符串 hash

哈希表的构建

哈希表的存储方式有两种, 分别是拉链法和开放地址法

拉链法

拉链法中 h数组每个元素 h[i] 存储的是指向某个单链表的指针

开放地址法

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
#include <iostream>
#include <cstring>
using namespace std;

//开放地址法使用的数组长度是输入数据量级的 2 到 3 倍. 现已已知输入数据量级为100000. 同时选取一个质数可更好地hash
const int N = 200003;

//0x3f3f3f3f是属于 10^9量级的数, 同时他比 10^9要大, 我们用这个数来定义为 null, 表示这个坑位里面没有元素
int h[N], null = 0x3f3f3f3f;

//find函数返回 x 所在的位置, 如果 x 不存在,则返回他应该存入的位置
int find(int x) {
    //找到 x 应该存在的位置(下标)
    int k = (x % N + N) % N;
    //如果这个位置存在元素并且这个元素不是 x, 那么指针后移直到找到x所在的位置或者找到x应该存储的位置
    while(h[k] != null && h[k] != x) k++;
    //返回 x所在的位置 或 x应该存储的位置
    return k;
}

int main() {
    int n;
    cin >> n;
    //因为h是int类型的数组一个int占用4个字节, memset可以对每个字节置为3f, 所以4个字节就是4个3f, 即 3f3f3f3f. 这样就可把每个int设置为上面定义的null了
    memset(h, 0x3f, sizeof(h));
    while(n--) {
        char op[2];
        int x;
        scanf("%s%d", op, &x);
        //x所在的位置 或 x应该存储的位置
        int k = find(x);
        //直接把这个位置的元素设置为 x 
        if(op[0] == 'I') h[k] = x;
        else printf("%s\n", h[k] != null ? "Yes" : "No"); //判断这个位置是否为null, 如果为 null,那么这个hash表中不存在x
        
    }
    
    return 0;
}

字符串哈希

除了求循环结问题, 其他场景字符串 hash基本可以代替 kmp算法,