「BZOJ3555」[Ctsc2014] 企鹅QQ
Description
PenguinQQ是中国最大、最具影响力的SNS(Social Networking Services)网站,以实名制为基础,为用户提供日志、群、即时通讯、相册、集市等丰富强大的互联网功能体验,满足用户对社交、资讯、娱乐、交易等多方面的需求。
小Q是PenguinQQ网站的管理员,他最近在进行一项有趣的研究——哪些账户是同一个人注册的。经过长时间的分析,小Q发现同一个人注册的账户名称总是很相似的,例如Penguin1,Penguin2,Penguin3……于是小Q决定先对这种相似的情形进行统计。
小Q定义,若两个账户名称是相似的,当且仅当这两个字符串等长且恰好只有一位不同。例如“Penguin1”和“Penguin2”是相似的,但“Penguin1”和“2Penguin”不是相似的。而小Q想知道,在给定的 个账户名称中,有多少对是相似的。
为了简化你的工作,小Q给你的 个字符串长度均等于 ,且只包含大小写字母、数字、下划线以及‘@’共64种字符,而且不存在两个相同的账户名称。
Input
第一行包含三个正整数 , , 。其中 表示账户名称数量, 表示账户名称长度, 用来表示字符集规模大小,它的值只可能为2或64。
若 等于2,账户名称中只包含字符‘0’和‘1’共2种字符;
若 等于64,账户名称中可能包含大小写字母、数字、下划线以及‘@’共64种字符。
随后 行,每行一个长度为 的字符串,用来描述一个账户名称。数据保证 个字符串是两两不同的。
Output
仅一行一个正整数,表示共有多少对相似的账户名称。
Sample Input
Fax
fax
max
mac
Sample Output
HINT
4对相似的字符串分别为:Fax与fax,Fax与max,fax与max,max与mac。N<=30000,L<=200,S<=64
题解
枚举删去某一位。然后hash表,排序之类的
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 |
#include<iostream> #include<cstring> #include<cstdio> #include<cstdlib> #include<algorithm> #include<queue> #include<cmath> #include<map> #include<queue> #define ll unsigned long long #define inf 2000000000 using namespace std; inline int read() { int x=0,f=1;char ch=getchar(); while(ch<'0'||ch>'9'){if(ch=='-')f=-1;ch=getchar();} while(ch>='0'&&ch<='9'){x=x*10+ch-'0';ch=getchar();} return x*f; } int ans,n,m,K; char ch[205]; ll H1[30005][205],G1[30005][205]; ll tmp[30005]; void cal(int x) { for(int i=1;i<=m;i++) { H1[x][i]=(H1[x][i-1]*149+ch[i]); } for(int i=m;i;i--) { G1[x][i]=(G1[x][i+1]*137+ch[i]); } } int main() { n=read();m=read();K=read(); for(int i=1;i<=n;i++) { scanf("%s",ch+1); cal(i); } for(int j=1;j<=m;j++) { for(int i=1;i<=n;i++) { tmp[i]=(H1[i][j-1]*233+G1[i][j+1]*213); } sort(tmp+1,tmp+n+1); int now=1; for(int i=2;i<=n;i++) { if(tmp[i]==tmp[i-1])ans+=now,now++; else now=1; } } printf("%d\n",ans); return 0; } |
黄学长这些模数调了多久,我被自然溢出卡疯了
我写完就过了好像
蒟蒻还有几个问题:
1、这种溢出的取模是不是相比模大质数容易被卡,通常用什么?
2、这种 分别看成两种进制数的hash方法 和 分别模两个大质数 的hash 有啥区别?
3、一个正着搞,一个倒着搞,仅仅是为了去掉一位的时候好加么?
4、tmp =(H1 [j-1]*233+G1 [j+1]*213); 为何这么再乘一下就减少冲突概率了呢?
求神犇指教
自然溢出容易被卡,但是速度更快,用于初步判重
正反搞是为了加速
哈希表的各种做法都并不是减少冲突概率,而是防止被构造数据卡程序
哦,多谢指教Orz
不取模的话会爆掉吧0.0,是直接看做对2^64取模么?可是爆掉之后不就变成负数了么,符号位没有影响吗?求大神指教Orz
unsigned是不会变成负数的,这是自然溢出TAT
是我脑残看错了QAQ