您的位置:首页 > Web前端 > JavaScript

javascript字符串

2015-08-19 17:07 471 查看

多行

字符串默认只能写在一行内,分成多行将会报错。

可以使用连接运算符(+)连接多个单行字符串,用来模拟多行字符串。

var str= 'Hello' +
'world' +
'I\'m' +
'coming'; // "Hello world I'm coming"


也可以在每一行的尾部使用反斜杠

var str= "Hello \
world \
I'm \
coming"; // "Hello world I'm coming"


不过这种方式有两点需要注意

(1) 它是ECMAScript 5新添加的,老式浏览器(如IE 8)不支持

(2) 反斜杠的后面必须是换行符,而不能有其他字符(比如空格),否则会报错。

转义

如果非特殊字符前面使用反斜杠,则反斜杠会被省略。

'\a'; // "a"


字符串与数组

字符串可以被视为字符数组,可以使用数组的方括号运算符,用来返回某个位置的字符,但无法改变字符串之中的单个字符。

length属性返回字符串的长度,该属性也是无法改变的。

字符串与数组的关系仅此而已。

字符集

JavaScript使用Unicode字符集,使用16位(即2个字节)的UTF-16格式储存。也就是说,JavaScript的单位字符长度固定为2个字节。

对于U+0000到U+FFFF之间的字符,一个16位就够了(即2个字节);对于U+10000到U+10FFFF之间的字符,就需要2个16位(即4个字节),而且前两个字节在0xD800到0xDBFF之间,后两个字节在0xDC00到0xDFFF之间。浏览器会正确将这四个字节识别为一个字符,但是JavaScript内部的字符长度总是固定为16位,会把这四个字节视为两个字符。

var s1 = '©';
var s2 = '��';
console.log(s1.length); // 1
console.log(s2.length); // 2
console.log(s2.charAt(0) + s2.charAt(1)); // ��


处理字符串时要考虑字符编码的问题

// 把字符串变成数组
function getSymbols(string) {
var length = string.length;
var index = -1;
var output = [];
var character;
var charCode;
while (++index < length) {
character = string.charAt(index);
charCode = character.charCodeAt(0);
if (charCode >= 0xD800 && charCode <= 0xDBFF) {
output.push(character + string.charAt(++index));
} else {
output.push(character);
}
}
return output;
}


方法

String

用来生成字符串的包装对象

如果不用new,还可以当作工具方法使用,将任意类型的值转为字符串

String(true) // "true"
String(5) // "5"


fromCharCode

String对象直接提供的方法,根据Unicode编码,生成一个字符串。

String.fromCharCode(104, 101, 108, 108, 111); // "hello"
String.fromCharCode(0x20BB7); // "ஷ"
String.fromCharCode(0xD842, 0xDFB7); // "��"


charAt

返回一个字符串的给定位置的字符,位置从0开始编号。

charCodeAt

返回给定位置字符的Unicode编码(十进制表示)。

concat

用于连接两个字符串,原字符串不受影响,返回一个新字符串。

可以接受多个字符串。

"a".concat("b","c"); // "abc"


substring、substr、slice

这三个方法都用来返回一个字符串的子串,而不会改变原字符串。

它们都可以接受一个或两个参数

第一个参数都是子字符串的开始位置

如果省略第二个参数,则表示子字符串一直持续到原字符串结束

第二个参数对于slice和substring方法,表示子字符串的结束位置;对于substr,表示子字符串的长度。

如果第一个参数大于第二个参数,slice方法并不会自动调换参数位置,而是返回一个空字符串。

如果参数为负,对于slice方法,表示字符位置从尾部开始计算。对于substring方法,会自动将负数转为0。对于substr方法,负数出现在第一个参数,表示从尾部开始计算的字符位置;负数出现在第二个参数,将被转为0。

indexOf、lastIndexOf

一个字符串在另一个字符串中的位置,如果返回-1,就表示不匹配。

还可以接受第二个参数,对于indexOf,表示从该位置开始向后匹配;对于lastIndexOf,表示从该位置起向前匹配。

不可为负数。

trim

去除字符串两端的空格

"  hello world  ".trim(); // "hello world"


toLowerCase、toUpperCase

localeCompare

比较两个字符串。它返回一个数字,如果小于0,表示第一个字符串小于第二个字符串;如果等于0,表示两者相等;如果大于0,表示第一个字符串大于第二个字符串。

'apple'.localeCompare('banana'); // -1
'apple'.localeCompare('apple'); // 0


下面是与搜索和替换相关的有4个方法,它们都允许使用正则表达式

match

match方法返回一个数组,成员为匹配的第一个字符串。如果没有找到匹配,则返回null。返回数组还有index属性和input属性,分别表示匹配字符串开始的位置(从0开始)和原始字符串。

var matches = "cat, bat, sat, fat".match("at");
console.log(matches) // ["at"]
matches.index // 1
matches.input // "cat, bat, sat, fat"


search

search方法的用法等同于match,但是返回值为匹配的第一个位置。如果没有找到匹配,则返回-1。

"cat, bat, sat, fat".search("at"); // 1


replace

用于替换匹配的子字符串,一般情况下只替换第一个匹配(除非使用带有g修饰符的正则表达式)。

"aaa".replace("a", "b"); // "baa"


split

按照给定规则分割字符串,返回一个由分割出来的各部分组成的新数组。

"a|b|c".split("|"); // ["a", "b", "c"]


如果分割规则为空字符串,则返回数组的成员是原字符串的每一个字符。

"a|b|c".split(""); // ["a", "|", "b", "|", "c"]


如果省略分割规则,则返回数组的唯一成员就是原字符串。

"a|b|c".split(); // ["a|b|c"]


如果满足分割规则的两个部分紧邻着(即中间没有其他字符),则返回数组之中会有一个空字符串。

"a||c".split("|"); // ["a", "", "c"]


如果满足分割规则的部分处于字符串的开头或结尾(即它的前面或后面没有其他字符),则返回数组的第一个或最后一个成员是一个空字符串。

"|b|c".split("|"); // ["", "b", "c"]
"a|b|".split("|"); // ["a", "b", ""]


split方法还可以接受第二个参数,限定返回数组的最大成员数。

"a|b|c".split("|", 0) // []
"a|b|c".split("|", 1) // ["a"]
"a|b|c".split("|", 2) // ["a", "b"]
"a|b|c".split("|", 3) // ["a", "b", "c"]
"a|b|c".split("|", 4) // ["a", "b", "c"]
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: