【数据结构与算法】Huffman编码/译码(C/C++)


实践要求

1. 问题描述

利用哈夫曼编码进行信息通讯可以大大提高信道利用率,缩短信息传输时间,降低传输成本。但是,这要求在发送端通过一个编码系统对待传数据预先编码;在接收端将传来的数据进行译码(复原)。对于双工信道(即可以双向传输信息的信道),每端都需要一个完整的编/译码系统。试为这样的信息收发站写一个哈夫曼码的编译码系统。


2. 基本要求

一个完整的系统应具有以下功能:

  1. I 初始化(Initialization)
    从终端读入字符集大小n,及n个字符和n个权值,建立哈夫曼树,并将它存于文件hfmtree中。
  2. C:编码(Coding)
    利用已建好的哈夫曼树(如不在内存,则从文件hfmtree中读 入),对文件tobetrans中的正文进行编码,然后将结果存入codefile中。
  3. D:译码(Decoding)
    利用已建好的哈夫曼树将文件codefile中的代码进行译 码,结果存入文件textfile中。
  4. P:印代码文件(Print)
    将文件codefile以紧凑格式显示在终端上,每行50个代 码。同时将此字符形式的编码文件写入文件codeprint中。
  5. T:印哈夫曼树(Tree print)
    将已在内存中的哈夫曼树以直观的方式 树或凹入表行式)显示在终端上,同时将此字符形式的哈夫曼树写入文件treeprint中。

3. 测试数据

可能出现8种字符,其概率分别为0.05,0.29,0.07,0.80,0.14,0.23,0.03,0.11试设计赫夫曼编码。

3.1 input

请输入字符串集大小

8

请输入字符和权值 //用空格分离

a 5
b 29
c 7
d 8
e 14
f 23
g 3
h 11

3.2 output

若要输出”abc”这个字符串的Huffman编码
(正确的结果应为0001111010)


实践报告

1. 题目分析

说明程序设计的任务,强调的是程序要做什么,此外列出各成员分工

程序设计任务:设计一个Huffman编码译码系统,有I:初始化;C:编码;D:译码;P:印代码文件;T:印Huffman树五个功能模块。


2. 数据结构设计

说明程序用到的数据结构的定义,主程序的流程及各模块之间的层次关系

该程序主要用到的数据结构是Huffman树(最优二叉树)

主程序流程图

图片[1] - 【数据结构与算法】Huffman编码/译码(C/C++) - MaxSSL


3. 程序设计

实现概要设计中的数据类型,对主程序、模块及主要操作写出伪代码,画出函数的调用关系

各模块伪代码

初始化

图片[2] - 【数据结构与算法】Huffman编码/译码(C/C++) - MaxSSL

编码

图片[3] - 【数据结构与算法】Huffman编码/译码(C/C++) - MaxSSL

解码

图片[4] - 【数据结构与算法】Huffman编码/译码(C/C++) - MaxSSL

打印

图片[5] - 【数据结构与算法】Huffman编码/译码(C/C++) - MaxSSL

打印并存入Huffman树

图片[6] - 【数据结构与算法】Huffman编码/译码(C/C++) - MaxSSL

各函数层次关系图

Initialization

图片[7] - 【数据结构与算法】Huffman编码/译码(C/C++) - MaxSSL

EnCode

图片[8] - 【数据结构与算法】Huffman编码/译码(C/C++) - MaxSSL

DeCode

图片[9] - 【数据结构与算法】Huffman编码/译码(C/C++) - MaxSSL

Tree

图片[10] - 【数据结构与算法】Huffman编码/译码(C/C++) - MaxSSL


4. 调试分析

程序复杂度分析

1. 空间复杂度
o(n)o(n) o(n)
空间复杂度主要是由节点的内存空间和最小堆的内存空间所占据的空间所决定的,因此总的空间复杂度为O(n)。
2. 时间复杂度
O(nlogn)O(nlogn) O(nlogn)
由于建立哈夫曼树的过程中需要使用最小堆来实现节点的排序和合并。最小堆的插入和删除操作都需要O(logn)的时间复杂度,而需要进行n-1次操作,因此总的时间复杂度为O(nlogn)

所遇到的问题的解决方法

  • 问题1:内存泄露问题,动态分配的空间未释放。
    解决:在函数解放使用free来释放动态分配的空间
  • 问题2:按格式读取文件信息
    解决:使用buffer和characters两个数组,buffer用于接收所有的txt文件中的内容,将buffer中有用的信息赋值给characters。

5. 测试结果

列出测试结果,包括输入和输出

测试结果一

先初始化将字符以及其权值存入txt文件中

图片[11] - 【数据结构与算法】Huffman编码/译码(C/C++) - MaxSSL
图片[12] - 【数据结构与算法】Huffman编码/译码(C/C++) - MaxSSL

再对其进行编码

图片[13] - 【数据结构与算法】Huffman编码/译码(C/C++) - MaxSSL
图片[14] - 【数据结构与算法】Huffman编码/译码(C/C++) - MaxSSL

对编码结果进行解码

图片[15] - 【数据结构与算法】Huffman编码/译码(C/C++) - MaxSSL

打印Huffman树并存入txt中

图片[16] - 【数据结构与算法】Huffman编码/译码(C/C++) - MaxSSL


6. 用户使用说明

给出主界面及主要功能界面

使用说明

首先初始化Huffman树,然后进行编码,编码后可选择译码也可以选择印代码文件或者印Huffman树。

7. 附录

源程序文件清单:
huffman.cpp
treeprint.txt
textfile.txt
hfmtree.txt
codefile.txt
codeprint.txt

8. 全部代码

huffman.cpp

#include #include #include #include using namespace std;// 定义哈夫曼树的节点结构体typedef struct node{int weight; // 权值char character; // 字符struct node *left;// 左子树指针struct node *right; // 右子树指针} Node;// 定义哈夫曼树的节点类型typedef Node *HuffmanTree;// 定义哈夫曼树的节点最小堆typedef struct heap{int size;// 堆的大小int capacity;// 堆的容量HuffmanTree *data; // 堆数据存储指针} MinHeap;// 初始化最小堆MinHeap *initMinHeap(int capacity){// 动态分配最小堆MinHeap *heap = (MinHeap *)malloc(sizeof(MinHeap));heap->capacity = capacity;heap->size = 0;heap->data = (HuffmanTree *)malloc(sizeof(HuffmanTree) * capacity);return heap;}// 最小堆中插入元素void insert(MinHeap *heap, HuffmanTree node){if (heap->size >= heap->capacity){return; // 如果堆已满,直接退出}heap->data[heap->size] = node;// 将元素插入堆底int current = heap->size++; // 更新堆大小int parent = (current - 1) / 2; // 父节点的下标// 自下往上调整堆,直到找到合适的位置插入新元素while (parent >= 0 && heap->data[current]->weight < heap->data[parent]->weight){// 如果当前元素比父节点的权值小,则交换两个元素的位置HuffmanTree temp = heap->data[parent];heap->data[parent] = heap->data[current];heap->data[current] = temp;current = parent;parent = (current - 1) / 2;}}// 从最小堆中取出最小元素HuffmanTree extractMin(MinHeap *heap){if (heap->size == 0) // 如果堆为空,直接返回空指针{return NULL;}HuffmanTree min = heap->data[0];// 最小元素即为堆顶元素heap->data[0] = heap->data[--heap->size]; // 将堆底元素移到堆顶,并更新堆大小int current = 0;// 当前节点的下标int child = current * 2 + 1;// 当前节点的左孩子的下标// 自上往下调整堆,直到找到合适的位置插入堆底元素while (child < heap->size) // 当前节点还有孩子节点{if (child + 1 < heap->size && heap->data[child + 1]->weight < heap->data[child]->weight){child++; // 找到当前节点的左右孩子中较小的一个}if (heap->data[child]->weight < heap->data[current]->weight){// 将当前节点和较小孩子节点交换位置HuffmanTree temp = heap->data[child];heap->data[child] = heap->data[current];heap->data[current] = temp;current = child; // 更新当前节点的下标child = current * 2 + 1; // 更新当前节点的左孩子下标}else{break; // 如果已经满足最小堆的性质,则退出循环}}return min; // 返回被取出的最小元素}// 用最小堆构建哈夫曼树HuffmanTree buildHuffmanTree(int *weights, char *characters, int n){// 初始化最小堆,将每个字符及其权重转换成节点,并插入堆中MinHeap *heap = initMinHeap(n);for (int i = 0; i < n; i++){Node *node = (Node *)malloc(sizeof(Node));node->weight = weights[i];node->character = characters[i];node->left = NULL;node->right = NULL;insert(heap, node); // 将节点插入堆中}// 不断从最小堆中取出权重最小的两个节点,合并成一个新节点,再插入堆中while (heap->size > 1){HuffmanTree left = extractMin(heap);// 取出堆顶节点,即最小权重节点HuffmanTree right = extractMin(heap); // 再次取出最小权重节点Node *parent = (Node *)malloc(sizeof(Node));parent->weight = left->weight + right->weight; // 新节点的权重为左右节点的权重之和parent->left = left; // 将左节点作为新节点的左孩子parent->right = right; // 将右节点作为新节点的右孩子insert(heap, parent);// 将新节点插入堆中}HuffmanTree root = extractMin(heap); // 最后堆中只剩下根节点,即为哈夫曼树的根节点free(heap->data);// 释放堆数组占用的空间free(heap);// 释放最小堆结构体占用的空间return root; // 返回哈夫曼树的根节点指针}// 对单个字符进行编码模块char *encodeChar(HuffmanTree root, char ch){static char code[100]; // 申请存储编码的空间static int index = 0;// 记录编码位数if (root == NULL){return NULL;}if (root->character == ch){code[index] = '\0'; // 编码结尾index = 0;// 编码位数归零return code;}code[index++] = '0';char *leftCode = encodeChar(root->left, ch);if (leftCode != NULL){return leftCode;}index--; // 回溯code[index++] = '1';char *rightCode = encodeChar(root->right, ch);if (rightCode != NULL){return rightCode;}index--; // 回溯return NULL;}// 对文本进行编码模块char *encode(HuffmanTree root, char *text){char *result = (char *)malloc(strlen(text) * 100 * sizeof(char)); // 申请存储编码结果的空间result[0] = '\0'; // 初始化for (int i = 0; i < strlen(text); i++){char *code = encodeChar(root, text[i]); // 对单个字符编码if (code){strcat(result, code); // 将编码拼接到结果中}}return result;}// 初始化函数HuffmanTree initialization(){int n; // 字符集大小printf("请输入字符集大小:\n");scanf("%d", &n);int *weights = (int *)malloc(sizeof(int) * n); // 动态分配n个权重值char *characters = (char *)malloc(sizeof(char) * n); // 动态分配n个字符printf("请输入字符和权值:\n");for (int i = 0; i < n; i++){scanf(" %c %d", &characters[i], &weights[i]);}HuffmanTree root = buildHuffmanTree(weights, characters, n);FILE *fp = fopen("hfmtree.txt", "w");fprintf(fp, "%d\n", n);for (int i = 0; i < n; i++){fprintf(fp, "%c%s", characters[i], i == n - 1 " />"\n" : " ");}for (int i = 0; i < n; i++){fprintf(fp, "%d%s", weights[i], i == n - 1 ? "\n" : " ");}fclose(fp);return root;}void EnCodeChar(HuffmanTree root){FILE *fp;char *characters;char buffer[100];int n;// 打开文件fp = fopen("hfmtree.txt", "r");if (fp == NULL){printf("文件打开失败\n");exit(1);}// 读取第一行,获取字符集大小fscanf(fp, "%d", &n);// 分配空间characters = (char *)malloc(n * sizeof(char));// 读取第二行数据fgets(buffer, sizeof(characters) * 2, fp);fgets(buffer, sizeof(characters) * 2, fp);int i = 0;int j = 0;while (buffer[i] != NULL){if (buffer[i] != ' '){characters[j] = buffer[i];j++;}i++;}fclose(fp);for (int i = 0; i < n; i++){int index = 0;char *res = encodeChar(root, characters[i]);printf("%c: %s\n", characters[i], res);}}void EnCode(HuffmanTree root){char tobetrans[100];char *result;printf("请输入一个字符串:\n");scanf("%s", tobetrans); // 读取输入的字符串,存储到字符数组中result = encode(root, tobetrans);printf("%s\n", result);FILE *fp = fopen("codefile.txt", "w");for (int i = 0; i < strlen(result); i++){fprintf(fp, "%c", result[i]);}fclose(fp);}char DeCodeChar(HuffmanTree root, char *code){HuffmanTree p = root;while (*code != '\0'){if (*code == '0'){p = p->left;}else if (*code == '1'){p = p->right;}if (p->left == NULL && p->right == NULL){return p->character;}code++;}return '\0';}void DeCode(HuffmanTree root){// 读取译码文件FILE *fp_code = fopen("codefile.txt", "r");char *code = (char *)malloc(1000 * sizeof(char)); // 申请存储代码的空间fscanf(fp_code, "%s", code);// 读取代码fclose(fp_code);// 译码char *text = (char *)malloc(1000 * sizeof(char)); // 申请存储译文的空间int i = 0, j = 0;while (code[i] != '\0'){char *tmp = (char *)malloc(100 * sizeof(char)); // 申请临时空间存储单个字符的编码int k = 0;while (DeCodeChar(root, tmp) == '\0'){tmp[k++] = code[i++];}text[j++] = DeCodeChar(root, tmp); // 译码并存储译文free(tmp); // 释放临时空间}text[j] = '\0';// 存储译文到文件中FILE *fp_text = fopen("textfile.txt", "w");fprintf(fp_text, "%s", text);fclose(fp_text);// 释放申请的空间free(code);free(text);}void Print(){FILE *fp;char buffer[100];fp = fopen("codefile.txt", "r");if (fp == NULL){printf("文件打开失败\n");exit(1);}// 读取数据fgets(buffer, 100, fp);printf("%s", buffer);fclose(fp);fp = fopen("codeprint.txt", "w");for (int i = 0; i < strlen(buffer); i++){fprintf(fp, "%c", buffer[i]);}fclose(fp);}// 打印哈夫曼树的函数void PrintHfmTree(FILE *file, HuffmanTree root, int level, char *prefix, int is_last){// 如果根节点为空,则返回if (root == NULL){return;}// 打印当前节点的值printf("%s", prefix);printf(is_last ? "└── " : "├── ");printf("(%c:%d)\n", root->character, root->weight);fprintf(file, "%s", prefix);fprintf(file, is_last ? "└── " : "├── ");fprintf(file, "(%c:%d)\n", root->character, root->weight);// 更新前缀char new_prefix[128];sprintf(new_prefix, "%s%s", prefix, is_last ? "" : "│ ");// 递归打印左右子树PrintHfmTree(file, root->left, level + 1, new_prefix, (root->right == NULL));PrintHfmTree(file, root->right, level + 1, new_prefix, 1);}void Tree(HuffmanTree root){// 打开文件treeprintFILE *file = fopen("treeprint.txt", "w");// 调用打印函数打印哈夫曼树并写入文件PrintHfmTree(file, root, 0, "", 1);// 关闭文件fclose(file);}HuffmanTree root = nullptr; // 将huffman树根设置为全局变量void Window(){char choice;char exit_choice;while (1){printf("请选择您的操作:\n");printf("I. 初始化\n");printf("C. 编码\n");printf("D. 译码\n");printf("P. 印代码文件\n");printf("T. 印哈夫曼树\n");printf("E. 退出\n");scanf(" %c", &choice); // 加上空格忽略换行符switch (choice){case 'I':printf("您选择了初始化操作。\n");root = initialization();break;case 'C':if (root == NULL){printf("请先进行初始化操作!\n");break;}printf("您选择了编码操作。\n");EnCode(root);break;case 'D':if (root == NULL){printf("请先进行初始化操作!\n");break;}printf("您选择了译码操作。\n");DeCode(root);break;case 'P':printf("您选择了打印操作。\n");Print();break;case 'T':printf("您选择了打印操作。\n");Tree(root);break;case 'E':printf("您确定要退出吗?按E键确认退出,按其他键返回上级菜单。\n");scanf(" %c", &exit_choice); // 加上空格忽略换行符if (exit_choice == 'E' || exit_choice == 'e'){printf("谢谢使用,再见!\n");return;}break;default:printf("无效的选择,请重新选择。\n");break;}}}int main(){Window();return 0;}

codefile.txt

0001111010

codeprint.txt

0001111010

hfmtree.txt

8a b c d e f g h5 29 7 8 14 23 3 11

textfile.txt

abc

treeprint.txt

└── (:100)├── (:42)│ ├── (:19)│ │ ├── (:8)│ │ │ ├── (g:3)│ │ │ └── (a:5)│ │ └── (h:11)│ └── (f:23)└── (:58)├── (:29)│ ├── (e:14)│ └── (:15)│ ├── (c:7)│ └── (d:8)└── (b:29)

结束语

  因为是算法小菜,所以提供的方法和思路可能不是很好,请多多包涵~如果有疑问欢迎大家留言讨论,你如果觉得这篇文章对你有帮助可以给我一个免费的赞吗?我们之间的交流是我最大的动力!

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享