yanakad · March 27, 2015 15:48 · yanakad · Mar 27, 2015
diff --git a/elasticsearch-spark b/elasticsearch-spark
 wget http://www.eng.lsu.edu/mirrors/apache/spark/spark-1.2.1/spark-1.2.1-bin-hadoop2.3.tgz
 tar -xf spark-1.2.1-bin-hadoop2.3.tgz
 cd spark-1.2.1-bin-hadoop2.3/bin/
 wget https://oss.sonatype.org/content/repositories/snapshots/org/elasticsearch/elasticsearch-hadoop/2.1.0.BUILD-SNAPSHOT/elasticsearch-hadoop-2.1.0.BUILD-20150324.023417-341.jar
 ./spark-shell --jars elasticsearch-hadoop-2.1.0.BUILD-20150324.023417-341.jar
 
 import org.apache.spark.sql.SQLContext

 case class KeyValue(key: Int, value: String)
 val sqlContext = new org.apache.spark.sql.SQLContext(sc)

 import sqlContext._

 sc.parallelize(1 to 50).map(i=>KeyValue(i, i.toString)).saveAsParquetFile("large.parquet")
 parquetFile("large.parquet").registerTempTable("large")

 val schemaRDD = sql("SELECT * FROM large")
 import org.elasticsearch.spark._

 schemaRDD.saveToEs("test/spark")
	wget http://www.eng.lsu.edu/mirrors/apache/spark/spark-1.2.1/spark-1.2.1-bin-hadoop2.3.tgz
	tar -xf spark-1.2.1-bin-hadoop2.3.tgz
	cd spark-1.2.1-bin-hadoop2.3/bin/
	wget https://oss.sonatype.org/content/repositories/snapshots/org/elasticsearch/elasticsearch-hadoop/2.1.0.BUILD-SNAPSHOT/elasticsearch-hadoop-2.1.0.BUILD-20150324.023417-341.jar
	./spark-shell --jars elasticsearch-hadoop-2.1.0.BUILD-20150324.023417-341.jar

	import org.apache.spark.sql.SQLContext

	case class KeyValue(key: Int, value: String)
	val sqlContext = new org.apache.spark.sql.SQLContext(sc)

	import sqlContext._

	sc.parallelize(1 to 50).map(i=>KeyValue(i, i.toString)).saveAsParquetFile("large.parquet")
	parquetFile("large.parquet").registerTempTable("large")

	val schemaRDD = sql("SELECT * FROM large")
	import org.elasticsearch.spark._

	schemaRDD.saveToEs("test/spark")