1.emoji表情符号应用场景及遇到的问题
emoji表情符号使用的场景:前端页面将用户带有emoji表情符号的留言发送给后端保存后,前端页面从后端获取留言再次展现。但是到再次从后端获取留言展示时,emoji表情符号不能正确展示。估计是后端数据库字符集不能兼容emoji表情符号,保存失败。emoji表情符号绝大部分(只有几个特殊的表情占2个字节除外)占用4个字节存储。
2.前端解决方案
在这里只介绍前端解决方案。解决思路:在前端发送请求前,将emoji表情符号转换成Unicode码点,再发送到后端;从后端获取的emoji表情符号的Unicode码点,再转换成emoji表情符号进行展示。
思路解释:通过思考和查资料测试,感觉将emoji表情转换为Unicode码点发送到后端保存比较适合应用场景。此时问题解决的关键点就是emoji表情符号与对应的Unicode码点之间的相互转换问题。
3.JavaScript内置编码方式
前端html页面字符集编码为utf-8,这种编码方式是一种变长的编码方式,它可以使用1-4个字节表示一个符号(字符),根据不同的符号而变化字节长度,故前端页面纯粹展示表情符号是没有问题的(emoji表情符号绝大部分(只有几个特殊的表情占2个字节除外)占用4个字节存储)。
JavaScript语言采用Unicode字符集,内部存储字符使用的utf-16(实际是usc-2,是utf-16的子集)编码方式。Utf-16编码方式,结合了定长和变长两种编码方式的特点,其编码长度要么是2个字节,要么是4个字节。经过测试, ES5中的String.prototype.charCodeAt(index)和String.fromCharCode(unicode)只能处理2个字节的字符,而 ES6 的String.prototype.codePointAt(index)和String.fromCodePoint(unicode)两个字符串函数则能处理4个字节的字符。问题解决。
4.带有emoji表情符号的字符串转换为Unicode码点字符串
function EmojiExchangeString() {
let str2 = document.getElementById('shuru').value;
let str2Arr = [];
str2.split('').map((val,index)=>{
str2Arr.push(val.codePointAt(0))
})
document.getElementById('chartlist').value = str2Arr.join(',');
}
5.Unicode码点字符串转换为带有emoji表情符号的字符串
function StringExchangeEmoji(){
let str3 = document.getElementById('chartlist').value;
let str3Arr = str3.split(',');
str3Arr.map((val, index)=>{
str3Arr[index] = Number(val);
})
console.log(str3Arr)
document.getElementById('emojilist').value = String.fromCodePoint(...str3Arr);
return result;
}
6.案例代码
function EmojiExchangeString() {
let str2 = document.getElementById('shuru').value;
let str2Arr = [];
str2.split('').map((val,index)=>{
str2Arr.push(val.codePointAt(0))
})
document.getElementById('chartlist').value = str2Arr.join(',');
}
function StringExchangeEmoji(){
let str3 = document.getElementById('chartlist').value;
let str3Arr = str3.split(',');
str3Arr.map((val, index)=>{
str3Arr[index] = Number(val);
})
console.log(str3Arr)
document.getElementById('emojilist').value = String.fromCodePoint(...str3Arr);
return result;
}