当前位置: 代码迷 >> 综合 >> [bzoj4198][哈夫曼树]荷马史诗
  详细解决方案

[bzoj4198][哈夫曼树]荷马史诗

热度:45   发布时间:2023-12-19 05:19:39.0

Description

追逐影子的人,自己就是影子。 ——荷马

Allison
最近迷上了文学。她喜欢在一个慵懒的午后,细细地品上一杯卡布奇诺,静静地阅读她爱不释手的《荷马史诗》。但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了,Allison
想通过一种编码方式使得它变得短一些。 一部《荷马史诗》中有 n 种不同的单词,从 1 到 n 进行编号。其中第 i 种单词出现的总次数为
wi。Allison 想要用 k 进制串 si 来替换第 i 种单词,使得其满足如下要求: 对于任意的 1≤i,j≤n,i≠j,都有:si
不是 sj 的前缀。 现在 Allison 想要知道,如何选择
si,才能使替换以后得到的新的《荷马史诗》长度最小。在确保总长度最小的情况下,Allison 还想知道最长的 si 的最短长度是多少?
一个字符串被称为 k 进制字符串,当且仅当它的每个字符是 0 到 k?1 之间(包括 0 和 k?1)的整数。 字符串 Str1
被称为字符串 Str2 的前缀,当且仅当:存在 1≤t≤m,使得 Str1=Str2[1..t]。其中,m 是字符串 Str2
的长度,Str2[1..t] 表示 Str2 的前 t 个字符组成的字符串。

Input

输入文件的第 1 行包含 2 个正整数 n,k,中间用单个空格隔开,表示共有 n 种单词,需要使用 k 进制字符串进行替换。

接下来 n 行,第 i+1 行包含 1 个非负整数 wi,表示第 i 种单词的出现次数。

Output

输出文件包括 2 行。

第 1 行输出 1 个整数,为《荷马史诗》经过重新编码以后的最短长度。 第 2 行输出 1 个整数,为保证最短总长度的情况下,最长字符串
si 的最短长度。

Sample Input

4 2

1

1

2

2

Sample Output

12

2

HINT

用 X(k) 表示 X 是以 k 进制表示的字符串。

一种最优方案:令 00(2) 替换第 1 种单词,01(2) 替换第 2 种单词,10(2) 替换第 3 种单词,11(2) 替换第 4
种单词。在这种方案下,编码以后的最短长度为:

1×2+1×2+2×2+2×2=12

最长字符串 si 的长度为 2。

一种非最优方案:令 000(2) 替换第 1 种单词,001(2) 替换第 2 种单词,01(2) 替换第 3 种单词,1(2) 替换第 4
种单词。在这种方案下,编码以后的最短长度为:

1×3+1×3+2×2+2×1=12

最长字符串 si 的长度为 3。与最优方案相比,文章的长度相同,但是最长字符串的长度更长一些。

对于所有数据,保证 2≤n≤100000,2≤k≤9。

选手请注意使用 64 位整数进行输入输出、存储和计算。

题解

哈夫曼树的应用
首先建出k叉的哈夫曼树,以字符串出现次数为叶子节点的权值,其他节点权值为0
那么对于每一个分支,分别填上0~k-1的数字
根节点到每个叶子节点路径长度即为替代这些单词的单词长度
根据定义,哈夫曼树的权值即为答案
这棵哈夫曼树可以看成一棵Tire,每个字符串不是其他字符串的前缀即为所有字符串在Tire中的结束节点均在叶子节点上而不在Tire里面。
由于题目要求最长的替代单词最短,即为要求哈夫曼树中最深的节点最浅,每次合并的时候对于权值相同的节点挑选深度较小的合并即可

#include<cstdio>
#include<cstring>
#include<cstdlib>
#include<algorithm>
#include<cmath>
#include<queue>
using namespace std;
typedef long long LL;
struct node
{int meg;LL c;node(){meg=0;c=0;}friend bool operator <(node n1,node n2){if(n1.c!=n2.c)return n1.c>n2.c;return n1.meg>n2.meg;}
};
priority_queue<node> q;
int n,k;
LL w[210000];
node cnt[15];
int main()
{scanf("%d%d",&n,&k);for(int i=1;i<=n;i++)scanf("%lld",&w[i]);while((n-1)%(k-1))w[++n]=0;for(int i=1;i<=n;i++){node tmp;tmp.c=w[i];tmp.meg=0;q.push(tmp);}LL ans=0;while(q.size()!=1){for(int i=1;i<=k;i++)cnt[i]=q.top(),q.pop();node tmp;tmp.meg=0;tmp.c=0;for(int i=1;i<=k;i++)tmp.c+=cnt[i].c,tmp.meg=max(tmp.meg,cnt[i].meg);tmp.meg++;ans+=tmp.c;q.push(tmp);}node tmp=q.top();printf("%lld\n%d\n",ans,tmp.meg);return 0;
}