短链接
短链接就是将长度较长的链接压缩成较短的链接。
好处:便于发布、传播。
短链跳转访问原理
其实就是在后台保存有短链和长链的映射关系,然后进行重定向,让浏览器跳转到对应的长链接。首先访问短链接,根据短链接查询数据库获取完整长链接,返回301或者302,让浏览器重定向到目标地址,浏览器跳转到长链接。
例子:当访问短链接,https://域名/xxx时,后端返回了302,同时多了一个Location响应头,值就是原始链接地址。
关于重定向:
- 301 永久重定向
- 302 临时重定向 (很多短链生成平台其实都是走的302重定向)
解决方案:
第一种是对 URL 进行hash运算,得到较短的hash值,Murmur哈希就是其中之一。既然是通过哈希函数,就避免不了哈希冲突。虽然这概率很低,但我们设计系统时需要考虑。
第二种对数据存储,由短链接跳转到长链接,肯定有必然的关系,我们需要把他们保存起来,存储的方式有Redis、Mysql等数据库。
例子:如果是Mysql存储,表结构大概有(自增id、短链接、长链接、创建时间)这些字段;我们可以通过生成的短链接,查询数据库是否有存在的短链接。不存在,直接存储;存在,需要二次拼接生成短链接,直到不存在为止,进行存储。如果当数据库数据变多,我们需要优化,短链接字段需要加唯一性索引。如果再一次优化,可以使用布隆过滤器,将新生成的短链接在布隆过滤器里进行查找,不存在直接插入数据库。
生成短链接方法:
- 根据唯一自增id后,再转换为62进制字符串,生成短链接。优点:ID唯一,生成的短链不会重复和冲突;缺点:高并发下有性能瓶颈。
- 雪花算法。优点:高性能;缺点:生成的ID比较长。
- Redis自增。优点:高性能,高并发;缺点:是中间件,有维护成本。
- Hash算法,常见有MD5、SHA算法。但这里我们一般采用Google的Murmurhash算法,优点:哈希冲突的概率低,速度比MD5快,缺点:有几率哈希冲突。
<!-- 引包 --> <dependency> <groupId>com.google.guava</groupId> <artifactId>guava</artifactId> <version>31.1-jre</version></dependency> <!-- 使用 --> public static void main(String[] args) { System.out.println(Hashing.murmur3_128().hashString("长链接", StandardCharsets.UTF_8)); System.out.println(Hashing.murmur3_32_fixed().hashString("长链接", StandardCharsets.UTF_8)); System.out.println(Hashing.murmur3_32_fixed().hashLong(Long.MAX_VALUE)); System.out.println(Hashing.murmur3_128().hashString("长链接", StandardCharsets.UTF_8).padToLong()); }
示例
使用用Hash算法 + Base62 编码生成短链。
数据库表结构
# 短链表create table `t_short_link`(`id` bigint primary key auto_increment comment '主键ID',`short_link` varchar(32)not null default '' comment '短链接',`long_link_hash` bigint not null default 0comment'hash值',`long_link`varchar(128) not null default '' comment '长链接',`status` tinyintnot null default 1comment '状态:1-可用,0-不可用',`expiry_time`datetime null comment '过期时间',`create_time`datetime not null default current_timestamp comment '创建时间') comment '短链表';# 创建对应的索引create index idx_sl_hash_long_link on t_short_link (long_link_hash, long_link);create index idx_sl_short_link on t_short_link (short_link);
工具类
/** * 短链接 - 工具类 */public class Base62Utils {private static final int SCALE = 62;// 下面的字符,可以随便打乱,安全性更高private static final char[] BASE_62_ARRAY = {'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M','N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z','a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm','n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z','0', '1', '2', '3', '4', '5', '6', '7', '8', '9'};private static final String BASE_62_CHARACTERS = String.valueOf(BASE_62_ARRAY);/** * 将long类型编码成Base62字符串 * @param num * @return */public static String encodeToBase62String(long num) {StringBuilder sb = new StringBuilder();while (num > 0) {sb.insert(0, BASE_62_ARRAY[(int) (num % SCALE)]);num /= SCALE;}return sb.toString();}/** * 将Base62字符串解码成long类型 * @param base62Str * @return */public static long decodeToLong(String base62Str) {long num = 0, coefficient = 1;String reversedBase62Str = new StringBuilder(base62Str).reverse().toString();for (char base62Character : reversedBase62Str.toCharArray()) {num += BASE_62_CHARACTERS.indexOf(base62Character) * coefficient;coefficient *= SCALE;}return num;}public static void main(String[] args) {String data = "6s3brYkS9OQp7YpY7RHR+GOJUdp//tdRrVPyiUcuJhJZPaHS9dStwDCdOWNWuHk=";Base64.Encoder encoder = Base64.getEncoder();System.out.println(encoder.encodeToString(data.getBytes()));Base64.Encoder encoder2 = Base64.getUrlEncoder();System.out.println(encoder2.encodeToString(data.getBytes()));// 编码 这个编码后 有 url的特殊字符System.out.println(URLEncoder.encode(data));}}
测试方法
@SpringBootTestpublic class ShortLinkTest {@Autowired(required = false)private ShortLinkService shortLinkService;// 生成短链接@Testvoid test1() throws Exception {String shortLink = shortLinkService.generateShortLink("https://www.good.com/xxx");System.err.println("生成的短链为:" + shortLink);}}
Service层
@Servicepublic class ShortLinkServiceImpl implements ShortLinkService {@Autowired(required = false)private ShortLinkManager shortLinkManager;/** * 生成短链接 * * @param longLink 长连接 * @return {@code String} */@Overridepublic String generateShortLink(String longLink) {// 使用 Murmurhash算法,进行哈希,得到长链接Hash值long longLinkHash = Hashing.murmur3_32_fixed().hashString(longLink, StandardCharsets.UTF_8).padToLong();System.out.println(longLinkHash); // 通过长链接Hash值和长链接检索 (查询数据库里是否唯一)String shortLink = "";// SQL 模拟操作 getShortLink(长链接Hash值,长链接) 判定是否唯一// SQL ...if (StringUtils.isNotBlank(shortLink)) {return shortLink;}// 如果Hash冲突则加随机盐再次Hashreturn regenerateOnHashConflict(longLink, longLinkHash);}// 参数1 长连接参数2 生成的Hashprivate String regenerateOnHashConflict(String longLink, long longLinkHash) {// 这个工具类是 雪花算法的工具类SnowFlakeUtils snowFlakeUtil = new SnowFlakeUtils();// 雪花算法 生成主键idlong id = snowFlakeUtil.nextId();long uniqueIdHash = Hashing.murmur3_32_fixed().hashLong(id).padToLong();// 相减主要是为了让哈希值更小String shortLink = Base62Utils.encodeToBase62String(Math.abs(longLinkHash - uniqueIdHash));System.out.println("产生更短的短连接" + shortLink);// SQL 模拟操作 isShortLinkRepeated(短链接) 判定是短链接否唯一// SQL ... 如果为false 代表 短链接不存在表中boolean isShort = false;if (!isShort) { // SQL 模拟操作 saveShortLink 保存表中 (shortLink、longLinkHash、longLink) // SQL ... return shortLink;}// 如果有 短链接 重复 再走一遍return regenerateOnHashConflict(longLink, longLinkHash);}}