lnicalo · July 6, 2015 19:32 · wjymath · Aug 3, 2017
diff --git a/gistfile1.py b/gistfile1.py
 How would you do the same in python with pyspark?

 I have written this piece of code but it does not work

 keyConv = "org.apache.spark.examples.pythonconverters.ImmutableBytesWritableToStringConverter"
 valueConv = "org.apache.spark.examples.pythonconverters.HBaseResultToStringConverter"

 data_conf = {
         "hbase.mapreduce.inputtable": "raw_signals",
        "hbase.mapreduce.scan.columns": "family1:col1 family2:col2",
        }

 hbase_rdd = sc.newAPIHadoopRDD(
        "org.apache.hadoop.hbase.mapreduce.TableInputFormat",
        "org.apache.hadoop.hbase.io.ImmutableBytesWritable",
        "org.apache.hadoop.hbase.client.Result",
        keyConverter=keyConv,
        valueConverter=valueConv,
        conf=data_conf)
	How would you do the same in python with pyspark?

	I have written this piece of code but it does not work

	keyConv = "org.apache.spark.examples.pythonconverters.ImmutableBytesWritableToStringConverter"
	valueConv = "org.apache.spark.examples.pythonconverters.HBaseResultToStringConverter"

	data_conf = {
	"hbase.mapreduce.inputtable": "raw_signals",
	"hbase.mapreduce.scan.columns": "family1:col1 family2:col2",
	}

	hbase_rdd = sc.newAPIHadoopRDD(
	"org.apache.hadoop.hbase.mapreduce.TableInputFormat",
	"org.apache.hadoop.hbase.io.ImmutableBytesWritable",
	"org.apache.hadoop.hbase.client.Result",
	keyConverter=keyConv,
	valueConverter=valueConv,
	conf=data_conf)