您的位置:首页 > 其它

Scala详解---------数组相关操作

2015-07-26 09:50 357 查看
Scala中提供了一种数据结构-数组,其中存储相同类型的元素的固定大小的连续集合。数组用于存储数据的集合,但它往往是更加有用认为数组作为相同类型的变量的集合。

取替声明单个变量,如number0, number1, ..., 和number99,声明一个数组变量,如号码和使用numbers[0],numbers[1],...,numbers[99]表示单个变量。本教程介绍了如何声明数组变量,创建数组和使用索引的过程变量数组。数组的第一个元素的索引是数字0和最后一个元素的索引为元素的总数减去1。


声明数组变量:

要使用的程序的数组,必须声明一个变量来引用数组,必须指定数组变量可以引用的类型。下面是语法声明数组变量:
var z:Array[String] = new Array[String](3)

or

var z = new Array[String](3)


在这里,z被声明为字符串数组,最多可容纳三个元素。可以将值分配给独立的元素或可以访问单个元素,这是可以做到通过使用类似于以下命令:
z(0) = "Zara"; z(1) = "Nuha"; z(4/2) = "Ayan"


在这里,最后一个例子表明,在一般的索引可以是产生一个全数字的表达式。定义数组还有另一种方式:
var z = Array("Zara", "Nuha", "Ayan")


下图展示了数组myList。在这里,myList中拥有10个double值,索引是从0到9。




处理数组:

当要处理数组元素,我们经常使用循环,因为所有的数组中的元素具有相同的类型,并且数组的大小是已知的。这里是展示如何创建,初始化和处理数组的完整的例子:
object Test {
   def main(args: Array[String]) {
      var myList = Array(1.9, 2.9, 3.4, 3.5)
      
      // Print all the array elements
      for ( x <- myList ) {
         println( x )
      }

      // Summing all elements
      var total = 0.0;
      for ( i <- 0 to (myList.length - 1)) {
         total += myList(i);
      }
      println("Total is " + total);

      // Finding the largest element
      var max = myList(0);
      for ( i <- 1 to (myList.length - 1) ) {
         if (myList(i) > max) max = myList(i);
      }
      println("Max is " + max);
    
   }
}


让我们编译和运行上面的程序,这将产生以下结果:
C:/>scalac Test.scala
C:/>scala Test
1.9
2.9
3.4
3.5
Total is 11.7
Max is 3.5

C:/>


多维数组:

有很多情况下,需要定义和使用多维数组(即数组的元素数组)。例如,矩阵和表格结构的实例可以实现为二维数组。

Scala不直接支持多维数组,并提供各种方法来处理任何尺寸数组。以下是定义的二维数组的实例:
var myMatrix = ofDim[Int](3,3)


这是一个具有每个都是整数,它有三个元素数组3元素的数组。下面的代码展示了如何处理多维数组:
import Array._

object Test {
   def main(args: Array[String]) {
      var myMatrix = ofDim[Int](3,3)
      
      // build a matrix
      for (i <- 0 to 2) {
         for ( j <- 0 to 2) {
            myMatrix(i)(j) = j;
         }
      }
      
      // Print two dimensional array
      for (i <- 0 to 2) {
         for ( j <- 0 to 2) {
            print(" " + myMatrix(i)(j));
         }
         println();
      }
    
   }
}


让我们编译和运行上面的程序,这将产生以下结果:
C:/>scalac Test.scala
C:/>scala Test
0 1 2
0 1 2
0 1 2

C:/>


联接数组:

以下是使用concat()方法来连接两个数组的例子。可以通过多个阵列作为参数传递给concat()方法。
import Array._

object Test {
   def main(args: Array[String]) {
      var myList1 = Array(1.9, 2.9, 3.4, 3.5)
      var myList2 = Array(8.9, 7.9, 0.4, 1.5)

      var myList3 =  concat( myList1, myList2)
      
      // Print all the array elements
      for ( x <- myList3 ) {
         println( x )
      }
   }
}


让我们编译和运行上面的程序,这将产生以下结果:
C:/>scalac Test.scala
C:/>scala Test
1.9
2.9
3.4
3.5
8.9
7.9
0.4
1.5

C:/>


创建具有范围数组:

下面是示例,这使得使用range() 方法来产生包含在给定的范围内增加整数序列的数组。可以使用最后一个参数创建序列; 如果不使用最后一个参数,然后一步将被假定为1。

import Array._

object Test {
   def main(args: Array[String]) {
      var myList1 = range(10, 20, 2)
      var myList2 = range(10,20)

      // Print all the array elements
      for ( x <- myList1 ) {
         print( " " + x )
      }
      println()
      for ( x <- myList2 ) {
         print( " " + x )
      }
   }
}


让我们编译和运行上面的程序,这将产生以下结果:
C:/>scalac Test.scala
C:/>scala Test
10 12 14 16 18
10 11 12 13 14 15 16 17 18 19

C:/>


Scala中数组方法:

以下是重要的方法,可以同时使用数组。如上所示,则必须使用任何提及的方法之前,要导入Array._包。有关可用方法的完整列表,请Scala中的官方文件。

SN方法及描述
1def apply( x: T, xs: T* ): Array[T]

创建T对象,其中T可以是Unit, Double, Float, Long, Int, Char, Short, Byte, Boolean数组。
2def concat[T]( xss: Array[T]* ): Array[T]

连接所有阵列成一个数组。
3def copy( src: AnyRef, srcPos: Int, dest: AnyRef, destPos: Int, length: Int ): Unit

复制一个数组到另一个。相当于Java的System.arraycopy(src, srcPos, dest, destPos, length).
4def empty[T]: Array[T]

返回长度为0的数组
5def iterate[T]( start: T, len: Int )( f: (T) => T ): Array[T]

返回一个包含一个函数的重复应用到初始值的数组。
6def fill[T]( n: Int )(elem: => T): Array[T]

返回包含某些元素的计算的结果的次数的数组。
7def fill[T]( n1: Int, n2: Int )( elem: => T ): Array[Array[T]]

返回一个二维数组,其中包含某些元素的计算的结果的次数。
8def iterate[T]( start: T, len: Int)( f: (T) => T ): Array[T]

返回一个包含一个函数的重复应用到初始值的数组。
9def ofDim[T]( n1: Int ): Array[T]

创建数组给出的尺寸。
10def ofDim[T]( n1: Int, n2: Int ): Array[Array[T]]

创建了一个2维数组
11def ofDim[T]( n1: Int, n2: Int, n3: Int ): Array[Array[Array[T]]]

创建3维数组
12def range( start: Int, end: Int, step: Int ): Array[Int]

返回包含一些整数间隔等间隔值的数组。
13def range( start: Int, end: Int ): Array[Int]

返回包含的范围内增加整数序列的数组。
14def tabulate[T]( n: Int )(f: (Int)=> T): Array[T]

返回包含一个给定的函数的值超过从0开始的范围内的整数值的数组。
15def tabulate[T]( n1: Int, n2: Int )( f: (Int, Int ) => T): Array[Array[T]]

返回一个包含给定函数的值超过整数值从0开始范围的二维数组。
数组相关操作

摘要:

本篇主要学习如何在Scala中操作数组。Java和C++程序员通常会选用数组或近似的结构(比如数组列表或向量)来收集一组元素。在Scala中,我们的选择更多,不过现在我们先假定不关心其他选择,而只是想马上开始用数组。本篇的要点包括:

1. 若长度固定则使用Array,若长度可能有变化则使用ArrayBuffer

2. 提供初始值时不要使用new

3. 用()来访问元素

4. 用for (elem<-arr)来遍历元素

5. 用for (elem<-arr if…)…yield…来将原数组转型为新数组

6. Scala数组和java数组可以互操作;用AnayBuffer,使用scalacollection.JavaConversions中的转换函数

定长数组

如果你需要一个长度不变的数组,可以用Scala中的Array。例如:

val nums=new Array[Int] (10) //长度为10的整数数组,所有元素初始化为0

val a=new Array [String] (10) //长度为10的字符串数组,所有元素初始化为null

val s= Array("Hello", "World") //长度为2的Array[String]类型是推断出来的,已提供初始值就不需要new

S (0) ="Goodbye" //Array("Goodby ","World"),使用()而不是[]来访问元素

在JVM中,Scala的Array以Java数组方式实现。示例中的数组在JVM中的类型为java.lang.String[]。Int、Double或其他与Java中基本类型对应的数组都是基本类型数组。

举例来说,Array(2,3,5,7,11)在JVM中就是一个int[]。

变长数组:缓冲

尾端操作缓冲数组
对于那种长度按需要变化的数组,Java有ArrayList,C++有vector。Scala中的等效数据结构为ArrayBuffer

import scala.collection.mutable.ArrayBuffer

val b=ArrayBuffer[lnt]() // 或者new ArrayBuffer [int],一个空的数组缓冲,准备存放整数

b+=1 // ArrayBuffer (1),用+=在尾端添加元素

b+=(1,2,3,5) // ArrayBuffer(1,1,2,3,5),在尾端添加多个元素,以括号包起来

b++= Array(8, 13, 21) // ArrayBuffer(1, 1, 2, 3, 5,
8,13, 21) //用++=操作符追加任何集合

b.trimEnd(5) // ArrayBuffer(1, 1, 2),移除最后5个元素

在数组缓冲的尾端添加或移除元素是一个高效的操作

任意位置操作缓冲数组
你也可以在任意位置插入或移除元素,但这样的操作并不那么高效。所有在那个位置之后的元素,都必须被平移。举例如下:

b.insert (2,6) //ArrayBuffer(1, 1,
6, 2),在下标2之前插入

b.insert (2,7,8,9) // ArrayBuffer(1, 1,7,8,9, 6,2),你可以插入任意多的元素

b.remove(2) // ArrayBuffer(1,1,8,9,6,2)

b.remove (2,3) //ArrayBuffer(1,1, 2),第2个参数的含义是要移除多少个元素

有时你需要构建一个Array,但不知道最终需要装多少元素。在这种情况下,先构建一个数组缓冲,然后调用:

b.toArray //Array(1, 1,2)
反过来,调用乱toBuffer可以将一个数组a转换成一个数组缓冲

遍历数组和数组缓冲

全遍历
在Java和C++中,数组和数组列表/向量有一些语法上不同,Scala则更加统一。大多数时候,你可以用相同的代码处理这两种数据结构。以下是for循环遍历数组或数组缓冲的语法:

for (i <- 0 until a.length) //变量i的取值从0到a length -1

println(i+":"+a(i))

utiI是Richlnt类的方法,返回所有小于但不包括上限的数字。例如:

0 until 10 // Range(0,1,2,3,4,5,6,7,8, 9)
需要注意的是,0 until 10实际上是一个方法调用:0.until(10)

条件遍历
如下结构:

for(I <- 区间)
会让变量i遍历该区间的所有值。拿本例来说,循环变量i先后取值0、1,等等,直到但不包含a.length。如果想要每两个元素一跳,可以让i这样来进行遍历:

0 until (a.length,2) //Range(0,2,4,…)
如果要从数组的尾端开始,遍历的写法为:

(0 until a.length) .reverse //Range(...,2,1,0)
如果在循环体中不需要用到数组下标,我们也可以直接访问数组元素,就像这样:

for (elem <- a)

println (elem)

这和Java中的"增强版"for循环,或者C++中的"基于区间的"for循环很相似。变量elem先后被设为a(0),然后a(1),依此类推

数组转换

for中的推导式和守卫
在前面,你看到了如何像Java或C++那样操作数组。不过在Scala中,你可以走得更远。从一个数组或数组缓冲出发,以某种方式对它进行转换是很简单的。这些转换动作不会修改原始数组,而是产生一个全新的数组。像这样使用for推导式

val a=Array(2, 3, 5, 7, 11)

val result=for (elem <- a)yield 2*elem //result是Array(4,6,10, 14, 22)

for(…)yield循环创建了一个类型与原始集合相同的新集合。如果你从数组出发,那么你得到的是另一个数组。如果你从数组缓冲出发,那么你在for(…)yield之后得到的也

是数组缓冲

结果包含yield之后的表达式的值,每次迭代对应一个。通常,当你遍历一个集合时,你只想处理那些满足特定条件的元素。这个需求可以通过守卫:for中的if来实现。在这里我们对每个偶数元素翻倍,并丢掉奇数元素:

for (elem <- a if elem%==0) yield 2*elem
请留意结果是个新的集合,原始集合并没有受到影响

一种等价方法
除上述之外,还有另一种做法是

a.filter (_%2==0).map(2*_)
甚至

a.filter { _%2 == 0 } map {2*_ }
某些有着函数式编程经验的程序员倾向于使用filter和map而不是守卫和yield,这不过是一种风格罢了与for循环所做的事完全相同。你可以根据喜好任意选择。

高效数组操作
考虑如下示例:给定一个整数的数组缓冲,我们想要移除除第一个负数之外的所有负数。传统的依次执行的解决方案会在遇到第一个负数时置一个标记,然后移除后续出现的负数元素

var first=true

var n=a.length

var i=0

while ( i<n ) {

if (a(i) >= 0)
i+=1
else{
if (first) {
first=false
i+=1
} else {
a.remove (i)
n-=1
}
}
}

但这个方案其实并不那么好:从数组缓冲中移除元素并不高效,把非负数值拷贝到前端要好得多。

首先收集需要保留的下标:

var first= true

val indexes=for (i <- 0 until a.length if first || a(i)>=0) yield {

if (a(i)<0)
first=false;
i
}

然后将元素移动到该去的位置,并截断尾端:

for(j <- 0 until indexes.length)

a(j)= a(indexes(j))
a.trimEnd (a.length -indexes.length)

这里的关键点是,拿到所有下标好过逐个处理

常用算法

求和与排序
有一种说法,很大比例的业务运算不过是在求和与排序。还好Scala有内建的函数来处理这些任务

Array(1,7,2, 9).sum // 19,对ArrayBuffer同样适用
要使用sum方法,元素类型必须是数值类型:要么是整型,要么是浮点数或者Biglnteger/BigDecimal。

同理,min和max输出数组或数组缓冲中最小和最大的元素。

ArraryBuffer("Mary", "had","a","little", "lamb").max // "little"
sorted方法将数组或数组缓冲排序并返回经过排序的数组或数组缓冲,这个过程并不会修改原始版本:

val b=ArrayBuffer(1,7,2, 9)

val bSorted=b.sorted(_ < _) // b没有被改变,bSorted是ArrayBuffer(1,2,7,9)

还可以提供一个比较函数,不过你需要用sortWith方法:

val bDescending=b.sorted(_ > _) // ArrayBuffer(9,7,2, 1)
可以直接对一个数组排序,但不能对数组缓冲排序:

val a=Array(1,7,2,9)

scala.util. Sorting.quickSortIa(a) // a现在是Array(1,2,7,9)

关于num、max和quickSort方法,元素类型必须支持比较操作,这包括了数字、字符串以及其他带有Ordered特质的类型。

显示数组内容
最后,如果你想要显示数组或数组缓冲的内容,可以用mkString方法,它允许你指定元素之间的分隔符。该方法的另一个重载版本可以让你指定前缀和后缀。例如:

a.mkString("and") // "1 and 2 and 7 and 9"

a.mkString("<" , "," , ">") // "<1,2,7,9>"

和toString相比:

a.toString // " [I@85b8d",这里被调用的是Java的毫无意义的toString方法

b.toString // "ArrayBuffer(l,7,2, 9)",toString方法报告了类型,便于调试

解读Scaladoc

数组和数组缓冲有许多有用的方法,我们可以通过浏览Scala文档来获取这些信息。对Array类的操作方法列在ArrayOps相关条目下。从技术上讲,在数组上应用这些操作之前,数组都会被转换成ArrayOps对象。

由于Scala的类型系统比java更丰富,在浏览Scala的文档时,你可能会遇到一些看上去很奇怪的语法。所幸,你并不需要理解类型系统的所有细节就可以完成很多有用

的工作。你可以把下表用做"解码指环"。



多维数组

和Java一样,多维数组是通过数组的数组来实现的。举例来说,Double的二维数组类型为:

Array[Array[Double]]
要构造这样一个数组,可以用ofDim方法:

val matrix=Array.ofDim[Double](3,4) //三行,四列要访问其中的元素,使用两对圆括号:

matrix (row) (column) =42

你可以创建不规则的数组,每一行的长度各不相同:

val triangle=new ArraylArray [Int] (10)

for (i <- 0 until triangle.length)

triangle(i)=new Array[lnt] (i+1)

与Java互操作

由于Scala数组是用java数组实现的,你可以在Java和Scala之间来回传递。如果你调用接受或返回java.utiI.List的Java方法,则当然可以在Scala代码中使用Java的ArrayList但那样做没什么意思。你完全可以引入scala.collection.JavaConversions里的隐式转换方法。这样你就可以在代码中使用Scala缓冲,在调用Java方法时,这些对象会被自动包装成Java列表。

举例来说,java.lang.ProcessBuilder类有一个以List<String>为参数的构造器。以下是在Scala中调用它的写法:

import scala.collection.JavaConversions.bufferAsJavaList

import scala.collection.mutable.ArrayBuffer

val command = ArrayBuffer("ls", "-al", "/home/cay")

val pb = new ProcessBuilder(command) // Scala到Java的转换

Scala缓冲被包装成了一个实现了java.util.List接口的Java类的对象。反过来讲,当Java方法返回java.util.List时,我们可以让它自动转换成一个Buffer:

import scala.collection.JavaConversions.asScalaBuffer

import scala.collection.mutable.Buffer

val cmd: Buffer[String] = pb.command() // Java到Scala的转换

需要注意的是,不能使用ArrayBuffer——包装起来的对象仅能保证是个Buffer。如果Java方法返回一个包装过的Scala缓冲,那么隐式转换会将原始的对象解包出来。拿本例来说,cmd == command

本文借鉴文章:
http://www.yiibai.com/scala/scala_arrays.html http://www.cnblogs.com/sunddenly/p/4411564.html
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: