本文共 7110 字,大约阅读时间需要 23 分钟。
字符串操作是计算机程序设计中最常见的行为。
String对象是不可变的
String对象是不可变的,可以给String对象加任意多得别名。
String对象具有只读特性,所以指向它的任何引用都不可能改变它的值。String a = "a";String b = a;System.out.println("first: a=" + a + " b=" + b);b = "b";System.out.println("second: a=" + a + " b=" + b);
运行结果:
first: a=a b=asecond: a=a b=b
String对象的不可变性会带来一定的效率问题。
比如为String对象重载的"+"操作符。重载:一个操作符在应用于特定类时,被赋予特殊的意义。Java中,用于String的"+"与"+="是仅有的两个重载过的操作符。Java不允许程序员重载任何操作符。
public class Connection { public static void main(String[] args) { String str = "hello"; String anotherStr = "abc" + str + "def" + 123; System.out.println(anotherStr); }}
Compiled from "Connection.java"public class Connection { public Connection(); Code: 0: aload_0 1: invokespecial #1 // Method java/lang/Object."":()V 4: return public static void main(java.lang.String[]); Code: 0: ldc #2 // String hello 2: astore_1 3: new #3 // class java/lang/StringBuilder 6: dup 7: invokespecial #4 // Method java/lang/StringBuilder." ":()V 10: ldc #5 // String abc 12: invokevirtual #6 // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder; 15: aload_1 16: invokevirtual #6 // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder; 19: ldc #7 // String def 21: invokevirtual #6 // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder; 24: bipush 123 26: invokevirtual #8 // Method java/lang/StringBuilder.append:(I)Ljava/lang/StringBuilder; 29: invokevirtual #9 // Method java/lang/StringBuilder.toString:()Ljava/lang/String; 32: astore_2 33: getstatic #10 // Field java/lang/System.out:Ljava/io/PrintStream; 36: aload_2 37: invokevirtual #11 // Method java/io/PrintStream.println:(Ljava/lang/String;)V 40: return}
Java中的每个类从根本上都是继承自Object。
public class Object { ... //Object类的toString方法 public String toString() { return getClass().getName() + "@" + Integer.toHexString(hashCode()); } ...}
标准容器类同样是继承自Object类,因此容器类都有toString()方法,并且覆写了这个方法来表达容器本身和它所包含的对象。
比如ArrayList.toString()方法,查看源代码可知,ArrayList类继承自AbstractList类,而AbstractList类覆写了toString()方法。 它会遍历AbstractList中所包含的所有对象,并调用每个元素上的toString方法。public abstract class AbstractCollectionimplements Collection { ... public String toString() { Iterator it = iterator(); if (! it.hasNext()) return "[]"; StringBuilder sb = new StringBuilder(); sb.append('['); for (;;) { E e = it.next(); sb.append(e == this ? "(this Collection)" : e); if (! it.hasNext()) return sb.append(']').toString(); sb.append(',').append(' '); } }...}
想打印对象的内存地址,应该调用super.toString()方法,也就是基类Object的toString()方法。
class A{ public static void main(String [] args){ System.out.println(new A()); } @Override public void toString(){ // return "A:"+this;//会造成递归调用,导致栈溢出。 return "A:"+super.toString(); }}
解决各种字符串处理相关的问题:匹配,选择,编辑以及验证。
以某种方式来描述字符串
Java中,\表示:插入一个正则表达式的反斜线,它后面的字符具有特殊的意义。
数字:\\d反斜线:\\\\
String类中的,正则匹配方法:
1.匹配matches()方法。查看源代码,可以知道该方法实际上是调用了Pattern类的matches()方法来实现正则表达式的匹配功能的。 2.分隔split()方法,这个方法能将字符串从正则表达式匹配的地方切开。 3.替代replaceAll(),replaceFirst()方法... public boolean matches(String regex) { return Pattern.matches(regex, this); } public String[] split(String regex, int limit) { /* fastpath if the regex is a (1)one-char String and this character is not one of the RegEx's meta characters ".$|()[{^?*+\\", or (2)two-char String and the first char is the backslash and the second is not the ascii digit or ascii letter. */ char ch = 0; if (((regex.value.length == 1 && ".$|()[{^?*+\\".indexOf(ch = regex.charAt(0)) == -1) || (regex.length() == 2 && regex.charAt(0) == '\\' && (((ch = regex.charAt(1))-'0')|('9'-ch)) < 0 && ((ch-'a')|('z'-ch)) < 0 && ((ch-'A')|('Z'-ch)) < 0)) && (ch < Character.MIN_HIGH_SURROGATE || ch > Character.MAX_LOW_SURROGATE)) { int off = 0; int next = 0; boolean limited = limit > 0; ArrayListlist = new ArrayList<>(); while ((next = indexOf(ch, off)) != -1) { if (!limited || list.size() < limit - 1) { list.add(substring(off, next)); off = next + 1; } else { // last one //assert (list.size() == limit - 1); list.add(substring(off, value.length)); off = value.length; break; } } // If no match was found, return this if (off == 0) return new String[]{ this}; // Add remaining segment if (!limited || list.size() < limit) list.add(substring(off, value.length)); // Construct result int resultSize = list.size(); if (limit == 0) { while (resultSize > 0 && list.get(resultSize - 1).length() == 0) { resultSize--; } } String[] result = new String[resultSize]; return list.subList(0, resultSize).toArray(result); } return Pattern.compile(regex).split(this, limit); } public String replaceFirst(String regex, String replacement) { return Pattern.compile(regex).matcher(this).replaceFirst(replacement); } public String replaceAll(String regex, String replacement) { return Pattern.compile(regex).matcher(this).replaceAll(replacement); } ...
[]
1.贪婪型
2.占有型 3.勉强型CharSequence
接口CharSequence从CharBuffer,String,StringBuffer,StringBuilder类之中抽象出字符序列的的一般化定义:interface CharSequence{ charAt(int i); length(); subSequence(int start,int end); toString();}
String类功能有限,我们可以自己构造强大的正则表达式对象。
导入java.util.regex包,使用静态方法Pattern.compile()来编译正则表达式。public static Pattern compile(String regex) { return new Pattern(regex, 0); }
compile()方法返回一个Pattern对象,表示编译后的正则表达式。
public Matcher matcher(CharSequence input) { if (!compiled) { synchronized(this) { if (!compiled) compile(); } } Matcher m = new Matcher(this, input); return m; }
对于已编译正则表达式的Pattern对象的matcher()方法,加上要被匹配的字符串,返回一个Matcher对象。
使用Matcher对象的各种方法,我们就能判断各种不同类型的匹配是否成功。boolean matches() //判断整个字符串是否匹配boolean lookingAt()//判断字符串的起始部分是否能够匹配boolean find()boolean find(int start)