forEach

迭代遍历集合中的每个元素,对每个元素进行处理 ,但是没有返回值 ,常用于打印结果数据 !

val ls = List(1,3,5,7,9)

ls.foreach(println) // 打印每个元素

ls.foreach(println(_))// 打印每个元素

ls.foreach(x=>println(x*10)) // 每个元素乘以10 打印结果

ls.foreach(x=>print(x+" "))// 打印每个元素 空格隔开

map

适用于任意集合

注意Map集合的用法:map函数遍历每个元素处理返回原集合类型的新集合 , 也可以不返回数据列表,数组,Map中都有map函数 元组中没有map函数

val arr = Array[String]("JAVA", "C++", "SCALA")

val ls = List(1, 3, 5, 7, 9)

val set = Set(1, 3, 5, 7)

val mp = Map[String, Int]("ZSS" -> 100, "LSS" -> 99)

// map函数遍历每个元素处理返回原集合类型的新集合

val new_arr: Array[String] = arr.map(x => x)

val new_list: List[Int] = ls.map(x => x)

val new_set: Set[Int] = set.map(x => x)

// Map集合使用map函数

val new_Map1: Map[String, Int] = mp.map({ case v: (String, Int) => (v._1, v._2 * 10) })

val new_Map2: Map[String, Int] = mp.map(e => (e._1, e._2 + 100))

// map函数也可以不返回数据

ls.map(println(_))

filter和filterNot

适用于: 数组 List Map

filter返回符合自己条件的新的集合,filterNot返回不符合自己条件的新的集合

val ls: List[Int] = List.range(1,10)

ls.filter(x=>x%2==0)

val new_list: List[Int] = ls.filter(_ % 2 == 0)// _ 代表每个元素

new_list .foreach(x=>print(x+" ")) // 2 4 6 8

ls.filterNot(_%2!=1).foreach(x=>print(x+" ")) 1 3 5 7 9

每个元素进行过滤

val set = Set("spark" , "scala" , "c++" , "java")

val new_set: Set[String] = set.filter(_.startsWith("s"))

set.filter(_.length>3)

多条件filter进行条件过滤

val ls = "spark":: "scala" :: "c++"::"java"::1::2::12.34::Nil

// 过滤出String类型的和Double类型的数据

ls.filter{

case i:String => true

case i:Int=>false

case i:Double=>true

}

连续使用多次filter进行条件过滤

// 连续使用多次filter进行条件过滤

val map = Map[String,Int](("zss" ,91),("zww",89),("zzx",92) , ("ww",23))

map.filter(_._1.startsWith("z")).filter(_._2>90)

collect

常用于: Array List Map

collect函数也可以遍历集合中的每个元素处理返回新的集合

val ls = List(1,2,3,4,"hello")

// 主要支持偏函数

val new_list: List[Int] = ls.collect({case i:Int=>i*10})

new_list.foreach(x=>print(x+" "))//10 20 30 40

// collect实现filter和map特性

list.collect({ case i: Int => i * 10

case i: String => i.toUpperCase

}).foreach(println)

val new_list2: List[Int] = ls.map({case x:Int=>x*10})

new_list2.foreach(x=>print(x+" "))// 错误 hello (of class java.lang.String)

因为collect支持偏函数 , 所以我们可以使用collect实现filter和map的特性!!!

val res: List[Int] = List(1, 2, 3, 4, 5, 6,"hello").collect({case i:Int if i%2==0=>i*10})

res.foreach(println) // 40 60 是不是牛逼闪电??

count

适用于 数组 List Map

def count(p: ((A, B)) => Boolean): Int

计算满足指定条件的集合元素数量

val arr = Array(1,2,345,67,5)

arr.count(_>5) // array list set 统用

val ls = List("hello" , "hi" , "heihei" , "tom")

ls.count(_.startsWith("h"))

ls.count(_.equals("hello"))

ls.count(_ == "hello")

// 忽略大小写

ls.count(_.equalsIgnoreCase("HELLO"))

// 统计符合条件的map元素的数量

val map = Map[String,Int]("a"->10,"ab"->10, "b"->99 , "c"->88)

map.count(x=>x._1.startsWith("a"))

map.count(_._2>10)

find

适用于 数组 List Map

查找符合要求的元素 , 匹配到就反回数据 ,最多只返回一个

Option中的数据要么是Some(T) 要么是None标识没有找到

val arr = Array(1,2,345,67,5)

val e: Option[Int] = arr.find(x=>x>1)

val ls = List("hello" , "hi" , "heihei" , "tom")

val res: Option[String] = ls.find(_.contains("a"))

if(res.isDefined){

println(res) //Some(hello)

println(res.get) //hello

}

val map = Map[String,Int]("a"->10,"ab"->10, "b"->99 , "c"->88)

val res_map: Option[(String, Int)] = map.find(x=>x._2>20)

if(res_map.isEmpty){

"没有匹配到内容"

}else{

// 打印数据

println(res_map.get)

}

0flatten

适用于 数组 List

压平 将一个集合展开 组成一个新的集合

val arr = Array(1,2,345,67,5.23)

//val res1: Array[Nothing] = arr.flatten I数值了类型的无法压平

val ls = List("hello" , "hi" , "heihei" , "tom")

val res2: Seq[Char] = ls.flatten // 压成单个字符 因为字符串属于序列集合的一种

val map = Map[String,Int]("a"->10,"ab"->10, "b"->99 , "c"->88)

// map无法直接压平

//val flatten: immutable.Iterable[Nothing] = map.flatten

// 压平存储Map集合的list 获取Map中每个元素

val ls1 = List[Map[String,Int]](Map[String,Int]("a"->10,"ab"->10) , Map[String,Int]("jim"->100,"cat"->99))

ls1.flatten // List((a,10), (ab,10), (jim,100), (cat,99))

val res: List[Int] = List(Array(1,2,3),Array(4,5,6)).flatten

// 错误 注意压平的数据的类型

val res4 = List(Array(1,2,3),Array("hel",5,6)).flatten

flatMap

适用于 数组 List

map+flatten方法的组合 ,先遍历集合中的每个元素 , 再按照指定的规则压平, 返回压平后的新的集合

val ls = List("today is my first day of my life" , "so I feel so happy")

// map处理每个元素 就是处理每句话

ls.map(x=>println(x))

// 获取集合中的每个元素 获取两句话 然后再扁平成字符

ls.flatMap(x=>x)

// 指定扁平化的规则 按照空格压平 压平的规则

ls.flatMap(x=>x.split(" ")).foreach(println) // 获取到每个单词

// 读取外部文件

val bs: BufferedSource = Source.fromFile("d://word.txt")

// 读取所有的数据行

val lines: Iterator[String] = bs.getLines()

// m遍历每行数据按照 \\s+ 切割返回一个新的迭代器

val words: Iterator[String] = lines.flatMap(_.split("\\s+"))

// 遍历迭代器 获取每个单词

words.foreach(println)

// 读取外部文件

val bs2: BufferedSource = Source.fromFile("d://word.txt")

// 获取所有的行数据

val lines2: Iterator[String] = bs2.getLines()

// 处理每行数据 切割单词后 每行返回一个数组 将所有的数组封装在迭代器中

val arrs: Iterator[Array[String]] = lines2.map(_.split("\\s+"))

mapValues

适用于 Map

mapValues方法只对Map集合的value做处理!

7.8.13sorted

适用于 数组 List Map

sorted 使用域简单的数字, 字符串等排序规则简答的集合进行排序 , 如果需要定制化排序建议使用sortBy 和 sortWith函数

List对数值

val list = List (1, 34 , 32 , 12 , 20 ,44 ,27)

// 返回排好序的list集合 默认从小到达排序

val sorted: List[Int] = list.sorted

对Array字符串

val arr = Array("jim" , "cat" , "jong" , "huba")

// 字符串默认按照先后排序

val sorted_arr: Array[String] = arr.sorted

对map

val map = Map[String , Int]("aeiqi"->4 , "qiaozhi"->2 , "baji"->34)

// map集合也没有sorted 函数 只有转换成List或者Array集合 默认按照key字典先后排序

val sorted_map: Seq[(String, Int)] = map.toList.sorted

sorted_map.foreach(println)

sortBy和sortWith

适用于 数组 List Map

var arr = Array(1, 11, 23, 45, 8, 56)

val arr1 = arr.sortBy(x => x) //ArraySeq(1, 8, 11, 23, 45, 56)

//按照数据倒序排列

val arr2 = arr.sortBy(x => -x) //(56, 45, 23, 11, 8, 1)

// 按照字典顺序排序

val arr3 = arr.sortBy(x => x.toString) //ArraySeq(1, 11, 23, 45, 56, 8)

// x 前面的元素 y 后面的元素

arr.sortWith((x, y) => x > y)

arr.sortWith((x, y) => x < y)

var list = List("hello", "cat", "happy", "feel")

// 字典顺序

list.sortBy(x => x)

// 执行排序

list.sortWith((x, y) => x > y)

list.sortWith((x, y) => x < y)

val map = Map("peiqi" -> 5, "jong" -> 3, "baji" -> 12)

map.toList.sortBy(x => x._1) //List((baji,12), (jong,3), (peiqi,5))

map.toList.sortBy(x => x._2) //List((jong,3), (peiqi,5), (baji,12))

// 指定key排序

map.toArray.sortWith((x,y)=>x._1>y._1)

map.toArray.sortWith((x,y)=>x._1

//指定value排序规则

map.toArray.sortWith((x,y)=>x._2>y._2)

map.toArray.sortWith((x,y)=>x._2

自定义类型在集合中的排序

val u1 = new User("wuji", 34)

val u2 = new User("zhiruo", 24)

val u3 = new User("zhoamin", 44)

val u4 = new User("cuishan", 64)

var arr = Array(u1, u2, u3, u4)

// 按照姓名字典排序

arr.sortBy(user => user.name)

//年龄小到大

arr.sortBy(user => user.age)

//数值类型的排序可以直接使用- 来倒序排列 年龄大到小

arr.sortBy(user => -user.age)

// 年龄大到小

arr.sortWith((user1, user2) => user1.age > user2.age)

// 年龄小到大

arr.sortWith((user1, user2) => user1.age < user2.age)

// 姓名字典升序

arr.sortWith((user1, user2) => user1.name < user2.name)

//姓名字典降序

arr.sortWith((user1, user2) => user1.name > user2.name)

grouped

将集合中的元素按照指定的个数进行分组

val list1 = List(1,2,3,4,5,6,7,8,9)

val list2 = List("scala" , "is" , "option" , "fucntion")

val map = Map[String,Int]("peiqi" -> 5, "jong" -> 3, "baji" -> 12)

// 两个元素分成一组 ,9个元素总共分成5组

val res: Iterator[List[Int]] = list1.grouped(2)

var i = 0

// 遍历每个元素

res.foreach(list=>{

i+=1

list.foreach(x=>println(x+"----"+i)) // 打印每个元素和它所对应的组

})

// 将map集合按照个数进行分组

val res2: Iterator[Map[String, Int]] = map.grouped(2)

res2.foreach(i=>i.foreach(x=>println((x._1,x._2))))

groupBy

将集合中的数据按照指定的规则进行分组

序列集合

val list1 = List(1,2,3,4,5,6,7,8,9)

val list2 = List("scala" , "is" , "option" , "fucntion")

// 对序列数据进行分组

val res1: Map[Boolean, List[Int]] = list1.groupBy(x=>x>3) //HashMap(false -> List(1, 2, 3), true -> List(4, 5, 6, 7, 8, 9))

val res2: Map[Boolean, List[Int]] = list1.groupBy(x=>x%2==0)//HashMap(false -> List(1, 3, 5, 7, 9), true -> List(2, 4, 6, 8))

list2.groupBy(x=>x.hashCode%2==0)

//HashMap(false -> List(is, option, fucntion), true -> List(scala))

val res: Map[Boolean, List[String]] = list2.groupBy(x=>x.startsWith("s"))

键值映射集合分组

val map = Map[String,Int]("peiqi" -> 5, "jong" -> 3, "baji" -> 12)

val arr = Array(("cat",21),("lucy",33),("book",22),("jack",34))

// 按照key和value的内容分组

println(map.groupBy(mp => mp._1))

println(map.groupBy(mp => mp._2))

// 根据key 或者 value 分成两组 满足条件的和不满足条件的

println(map.groupBy(mp => mp._1.hashCode%2==0))

println(map.groupBy(mp => mp._2>2))

// 对偶元组集合 和map的分组方式是一样的

arr.groupBy(arr=>arr._1)

arr.groupBy(arr=>arr._2)

reduce

底层调用的是reduceLeft , 从左边开始运算元素

val list = List(1,3,5,7,9)

// 每个元素累加 从左到右相加

val res1: Int = list.reduce(_+_) // 25

//1-3)-5)-7)-9

val res2: Int = list.reduce(_ - _) // -23

val arr = Array("haha", "heihei", "hehe")

// x 前面的元素 y 后面的元素 实现集合中字符串的拼接

val res3: String = arr.reduce((x, y) => x + " " + y) //haha heihei hehe

// 键值对元素的

val map = Map(("shaolin",88),("emei", 77),("wudang",99))

//(shaolin emei wudang,264) key value分别做归约操作

val res4: (String, Int) = map.reduce((m1,m2)=>(m1._1+" "+m2._1 , m1._2+ m2._2))

reduceLeft和reduceRight

val list = List(1, 3, 5, 7, 9)

val arr = Array("a", "b", "c","d","e")

val map = Map(("shaolin",88),("emei", 77),("wudang",99))

// 执行顺序是 1+3)+5)+7)+9

val res1: Int = list.reduceLeft(_+_)

// 1-3)-5)-7)-9

val res01: Int = list.reduceLeft(_-_)

val res2: String = arr.reduceLeft((a1, a2)=>a1+","+a2)

val res3: (String, Int) = map.reduceLeft((m1,m2)=>(m1._1+" "+m2._1 , m1._2+ m2._2))

println(res1) //25

println(res2) //a,b,c,d,e

println(res3)//(shaolin emei wudang,264)

val res11: Int = list.reduceRight(_+_) // 25

// 执行顺序是 a,(b,(c,(d,e))) a2 右边的最后一个元素

val res12: String = arr.reduceRight((a1, a2)=>a1+","+a2)//a,b,c,d,e

val res13: (String, Int) = map.reduceRight((m1,m2)=>(m1._1+" "+m2._1 , m1._2+ m2._2))//(shaolin emei wudang,264)

// 5-(7-9)-->5-(7-9)-->3-(5-(7-9))-->1-(3-(5-(7-9)))

val res14: Int = list.reduceRight(_-_)

println(res14) // 5

println(res11) //25

println(res12) //a,b,c,d,e

println(res13)//(shaolin emei wudang,264)

// 字符串的拼接

arr.reduce(_ ++ _)

// 字符串的拼接

println(arr.reduce(_ ++"."++ _))

0fold,foldLeft 和foldRight

归约操作类似于reduce函数 ,但是fold函数中多出来一个初始值

val arr = Array("tom" , "cat" , "jim" , "rose")

// 遍历集合中的每个元素进行拼接 比reduce函数多出一个初始值

val res = arr.fold("hello")(_+" "+_)

val ls = List(1,3,5,7)

// 100+1)+3)+5)+7 底层调用的是 foldLeft

val res2 = ls.fold(100)(_+_) // 116

ls.foldLeft(100)(_+_) // 116

从右边开始运算 默认的值先参与运算进来

// 7-10)-->5-(-3)-->3-8 -->1-(-5)

val res01: Int = ls.foldRight(10)(_-_) //6

交集差集并集

val arr1 = Array(1, 3, 5, 7, 0)

val arr2 = Array(5, 7, 8, 9)

val res1: Array[Int] = arr1.intersect(arr2) // 交集 5 7

val res2: Array[Int] = arr1.diff(arr2) // 差集 1 3

// 单纯的合并两个元素中的数据

val res3: mutable.ArraySeq[Int] = arr1.union(arr2) // 1,3,5,7 ,5,7,8,9

// 去除重复数据

val res4: mutable.ArraySeq[Int] = res3.distinct //,3,5,7,8,9

distinct和distinctBy

去除集合中的重复的元素 ,可以去除简单类型的数据, 也可以除去自定义的类型(底层依然是hashcode和equals)

val arr1 = Array("a", "a","ab","cat" ,"hellocat" ,"hicat")

val newarr: Array[String] = arr1.distinct

newarr.foreach(println)

条件去重

val arr1 = Array(new User("ls",21),new User("ls",22),new User("zss",21))

// 去除重名的重复数据

val res: Array[User] = arr1.distinctBy(x=>x.age)

res.foreach(x=> println(x.name))

zip

实现拉链式拼接, 只要操作的集合是迭代集合就可以拼接

val list1 = List("a" , "b" , "c" , "d")

val arr1 = Array(1,2,3,4)

val map = Map[String,Int]("aa"->11,"cc"->22,"dd"->33)

// 以两个迭代集合中少的一方为基准对偶拼接List((a,1), (b,2), (c,3))

val res: List[(String, Int)] = list1.zip(arr1)

//ArraySeq((1,(aa,11)), (2,(cc,22)), (3,(dd,33)))

val res2: Array[(Int, (String, Int))] = arr1.zip(map)

zipWithIndex

简单理解为 遍历集合中的每个元素 , 将每个元素打上对应的索引值 , 组成元组(element , index) 返回新的集合 !

val list1 = List("a" , "b" , "c" , "d")

val arr1 = Array(1,2,3,4)

val map = Map[String,Int]("aa"->11,"cc"->22,"dd"->33)

// List(((a,1),0), ((b,2),1), ((c,3),2), ((d,4),3))

list1.zip(arr1).zipWithIndex

//List((a,0), (b,1), (c,2), (d,3))

list1.zipWithIndex

scan

一个初始值开始,从左向右遍历每个元素,进行积累的op操作

val arr = Array("cat" , "jim" , "tom")

// ArraySeq(hello, hello cat, hello cat jim, hello cat jim tom)

arr.scan("hello" )(_ +" "+ _)

val nums = List(1,2,3)

// List(10,10+1,10+1+2,10+1+2+3) = List(10,11,13,16)

val result = nums.scan(10)(_+_)

nums.foldLeft(10)(_+_) // 16

mkString

将集合中的每个元素拼接成字符串

val arr = Array("a", "b", "c")

val str = arr.mkString

arr.mkString(" ")

arr.reduce(_+_)

arr.reduce(_ + " " + _)

slice,sliding

slice(from: Int, until: Int): List[A] 提取列表中从位置from到位置until(不含该位置)的元素列表, 起始位置角标从0开始;

slice val arr = Array("a", "b", "c" ,"d","e","f")

arr.slice(0 ,2) // res0: Array[String] = ArraySeq(a, b)

sliding

sliding(size: Int, step: Int): Iterator[List[A]] 将列表按照固定大小size进行分组,步进为step,step默认为1,返回结果为迭代器;

val nums = List(1,1,2,2,3,3,4,4)

// 参数一:子集的大小 参数二:步进

val res: Iterator[List[Int]] = nums.sliding(2,2)

res.toList // List(List(1, 1), List(2, 2), List(3, 3), List(4, 4))

take,takeRight,takeWhile

take 默认从左边开始取

val arr = Array("a", "b", "c" ,"d","e","f")

// 从左边获取三个元素,组成新的数组集合

arr.take(3)

takeRight 默认从右边开始取

val nums = List(1,1,1,1,4,4,4,4)

val right = nums.takeRight(4) // List(4,4,4,4)

takeWhile

// 小于4 终止

nums.takeWhile(_ < 4)

val names = Array ("cat", "com","jim" , "scala" ,"spark")

// 从左到右遍历符合遇到不符合条件的终止,储存在新的集合中

names.takeWhile(_.startsWith("c"))

Aggregate聚合

全局聚合

aggregate方法是一个聚合函数,接受多个输入,并按照一定的规则运算以后输出一个结果值,在2.13+版本中被foldLeft取代!

7.8.30集合间的转换函数

可变集合和不可变集合的转换

toArray 将其他类型的集合转换成数组 toList 将其他类型的集合转转成list toSet 将其他类型的集合转换成Set toSeq 将其他类型的集合转换成Seq序列 toMap 将对偶类型的集合转换成Map toString 将其他类型转换成字符串

参考文章

评论可见,请评论后查看内容,谢谢!!!
 您阅读本篇文章共花了: