日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

文檔

非EMR集群接入OSS-HDFS服務(wù)快速入門(mén)

OSS-HDFS服務(wù)(JindoFS服務(wù))完全兼容HDFS接口,同時(shí)支持目錄層級(jí)的操作。JindoSDK為Apache Hadoop的計(jì)算分析應(yīng)用(例如MapReduce、Hive、Spark、Flink等)提供了訪問(wèn)HDFS服務(wù)的能力。本文介紹如何通過(guò)在ECS實(shí)例中部署JindoSDK,然后完成OSS-HDFS服務(wù)快速入門(mén)常見(jiàn)操作。

說(shuō)明

如果您使用的是阿里云EMR集群,請(qǐng)通過(guò)EMR集群的方式接入OSS-HDFS服務(wù)。具體操作,請(qǐng)參見(jiàn)EMR集群接入OSS-HDFS服務(wù)快速入門(mén)。

前提條件

  • 阿里云賬號(hào)默認(rèn)擁有通過(guò)非EMR集群的方式接入OSS-HDFS服務(wù)并執(zhí)行常見(jiàn)操作的權(quán)限。如果您希望通過(guò)RAM用戶接入OSS-HDFS服務(wù),RAM用戶需要具備對(duì)應(yīng)的權(quán)限要求,詳情請(qǐng)參見(jiàn)授權(quán)RAM用戶通過(guò)非EMR集群接入OSS-HDFS服務(wù)

操作視頻

觀看以下視頻了解如何通過(guò)非EMR集群快速接入OSS-HDFS服務(wù)并完成常見(jiàn)操作。

操作步驟

  1. 連接ECS實(shí)例。具體操作,請(qǐng)參見(jiàn)連接ECS實(shí)例

  2. 下載并解壓JindoSDK JAR包。下載地址,請(qǐng)參見(jiàn)GitHub。

  3. 執(zhí)行以下命令,解壓JindoSDK JAR包。

    以下以解壓jindosdk-x.x.x-linux.tar.gz為例,如使用其他版本的JindoSDK,請(qǐng)?zhí)鎿Q為對(duì)應(yīng)的JAR包名稱。

    tar zxvf jindosdk-x.x.x-linux.tar.gz
    說(shuō)明

    x.x.x表示JindoSDK JAR包版本號(hào)。

  4. 配置環(huán)境變量。

    1. 配置JINDOSDK_HOME

      以安裝包內(nèi)容解壓在/usr/lib/jindosdk-x.x.x-linux目錄為例:

      export JINDOSDK_HOME=/usr/lib/jindosdk-x.x.x-linux
    2. 配置HADOOP_CLASSPATH。

      export HADOOP_CLASSPATH=$HADOOP_CLASSPATH:${JINDOSDK_HOME}/lib/*
      重要

      請(qǐng)將安裝目錄和環(huán)境變量部署到所有所需節(jié)點(diǎn)上。

  5. 配置OSS-HDFS服務(wù)實(shí)現(xiàn)類及AccessKey。

    1. 執(zhí)行以下命令,進(jìn)入Hadoop的core-site.xml配置文件。

      vim /usr/local/hadoop/etc/hadoop/core-site.xml
    2. 在Hadoop的core-site.xml中,配置JindoSDK DLS實(shí)現(xiàn)類。

      <configuration>
          <property>
              <name>fs.AbstractFileSystem.oss.impl</name>
              <value>com.aliyun.jindodata.oss.JindoOSS</value>
          </property>
      
          <property>
              <name>fs.oss.impl</name>
              <value>com.aliyun.jindodata.oss.JindoOssFileSystem</value>
          </property>
      </configuration>
    3. 在Hadoop的core-site.xml文件中,配置阿里云賬號(hào)的訪問(wèn)密鑰,或者滿足權(quán)限要求的RAM用戶的訪問(wèn)密鑰。

      關(guān)于RAM用戶在該場(chǎng)景下需要滿足的權(quán)限說(shuō)明,請(qǐng)參見(jiàn)授權(quán)RAM用戶通過(guò)非EMR集群接入OSS-HDFS服務(wù)。

      <configuration>
          <property>
              <name>fs.oss.accessKeyId</name>
              <value>xxx</value>
          </property>
      
          <property>
              <name>fs.oss.accessKeySecret</name>
              <value>xxx</value>
          </property>
      </configuration>
  6. 配置OSS-HDFS服務(wù)Endpoint。

    使用OSS-HDFS服務(wù)訪問(wèn)OSS Bucket時(shí)需要配置Endpoint。推薦訪問(wèn)路徑格式為oss://<Bucket>.<Endpoint>/<Object>,例如oss://examplebucket.cn-hangzhou.oss-dls.aliyuncs.com/exampleobject.txt。配置完成后,JindoSDK會(huì)根據(jù)訪問(wèn)路徑中的Endpoint訪問(wèn)對(duì)應(yīng)的OSS-HDFS服務(wù)接口。

    您還可以通過(guò)其他方式配置OSS-HDFS服務(wù)Endpoint,且不同方式配置的Endpoint存在生效優(yōu)先級(jí)。更多信息,請(qǐng)參見(jiàn)EMR集群接入OSS-HDFS服務(wù)快速入門(mén)

  7. 通過(guò)HDFS Shell命令完成OSS-HDFS服務(wù)常見(jiàn)操作。

    • 上傳文件

      將本地根目錄下的examplefile.txt文件上傳至examplebucket,示例如下:

      hdfs dfs -put examplefile.txt oss://examplebucket.cn-hangzhou.oss-dls.aliyuncs.com/
    • 下載文件

      將examplebucket下的exampleobject.txt下載到本地根目錄文件夾/tmp,示例如下:

      hdfs dfs -get oss://examplebucket.cn-hangzhou.oss-dls.aliyuncs.com/exampleobject.txt  /tmp/

    更多操作,請(qǐng)參見(jiàn)通過(guò)Hadoop Shell命令訪問(wèn)

附錄一:配置Endpoint的其他方式

除上述提到的在訪問(wèn)路徑中指定Endpoint的方式以外,您還可以通過(guò)以下兩種方式配置OSS-HDFS服務(wù)的Endpoint:

  • Bucket級(jí)別的Endpoint

    如果使用oss://<Bucket>/<Object>格式的訪問(wèn)路徑,即訪問(wèn)路徑中未設(shè)置Endpoint。此時(shí),您可以在Hadoop的配置文件core-site.xml中設(shè)置Bucket級(jí)別的Endpoint,從而指向OSS-HDFS服務(wù)的Endpoint。

    <configuration>
        <property>
            <!-- 以下examplebucket為開(kāi)通HDFS服務(wù)的Bucket名稱,其他Bucket請(qǐng)根據(jù)實(shí)際情況替換。 -->
            <name>fs.oss.bucket.examplebucket.endpoint</name>
            <!-- 以下以杭州地域?yàn)槔渌赜蛘?qǐng)根據(jù)實(shí)際情況替換。 -->
            <value>cn-hangzhou.oss-dls.aliyuncs.com</value>
        </property>
    </configuration>
  • 全局默認(rèn)Endpoint

    如果使用oss://<Bucket>/<Object>格式的訪問(wèn)路徑,且訪問(wèn)路徑中未設(shè)置Bucket級(jí)別的Endpoint,則默認(rèn)使用全局Endpoint的方式訪問(wèn)OSS-HDFS服務(wù)。在Hadoop的配置文件core-site.xml中設(shè)置全局默認(rèn)Endpoint的方式如下:

    <configuration>
        <property>
            <name>fs.oss.endpoint</name>
            <!-- 以下以杭州地域?yàn)槔渌赜蛘?qǐng)根據(jù)實(shí)際情況替換。 -->
            <value>cn-hangzhou.oss-dls.aliyuncs.com</value>
        </property>
    </configuration>
說(shuō)明

通過(guò)不同方式配置Endpoint后,Endpoint生效優(yōu)先級(jí)為訪問(wèn)路徑中的Endpoint>Bucket級(jí)別的Endpoint>全局默認(rèn)Endpoint

附錄二:性能調(diào)優(yōu)

您可以結(jié)合實(shí)際業(yè)務(wù)需求,將以下配置項(xiàng)添加到Hadoop的core-site.xml中。僅JindoSDK 4.0及以上版本支持以下配置項(xiàng)。

<configuration>

    <property>
          <!-- 客戶端寫(xiě)入的臨時(shí)文件目錄,可配置多個(gè),每個(gè)臨時(shí)文件目錄需以逗號(hào)隔開(kāi)。多用戶環(huán)境需配置可讀寫(xiě)權(quán)限 -->
        <name>fs.oss.tmp.data.dirs</name>
        <value>/tmp/</value>
    </property>

    <property>
          <!-- 訪問(wèn)OSS失敗重試次數(shù) -->
        <name>fs.oss.retry.count</name>
        <value>5</value>
    </property>

    <property>
          <!-- 請(qǐng)求OSS超時(shí)時(shí)間(毫秒) -->
        <name>fs.oss.timeout.millisecond</name>
        <value>30000</value>
    </property>

    <property>
          <!-- 連接OSS超時(shí)時(shí)間(毫秒) -->
        <name>fs.oss.connection.timeout.millisecond</name>
        <value>3000</value>
    </property>

    <property>
          <!-- OSS單個(gè)文件并發(fā)上傳線程數(shù) -->
        <name>fs.oss.upload.thread.concurrency</name>
        <value>5</value>
    </property>

    <property>
          <!-- OSS并發(fā)上傳任務(wù)隊(duì)列大小 -->
        <name>fs.oss.upload.queue.size</name>
        <value>5</value>
    </property>

    <property>
          <!-- 進(jìn)程內(nèi)OSS最大并發(fā)上傳任務(wù)數(shù) -->
        <name>fs.oss.upload.max.pending.tasks.per.stream</name>
        <value>16</value>
    </property>

    <property>
          <!-- OSS并發(fā)下載任務(wù)隊(duì)列大小 -->
        <name>fs.oss.download.queue.size</name>
        <value>5</value>
    </property>

    <property>
          <!-- 進(jìn)程內(nèi)OSS最大并發(fā)下載任務(wù)數(shù) -->
        <name>fs.oss.download.thread.concurrency</name>
        <value>16</value>
    </property>

    <property>
          <!-- 預(yù)讀OSS的buffer大小 -->
        <name>fs.oss.read.readahead.buffer.size</name>
        <value>1048576</value>
    </property>

    <property>
          <!-- 同時(shí)預(yù)讀OSS的buffer個(gè)數(shù) -->
        <name>fs.oss.read.readahead.buffer.count</name>
        <value>4</value>
    </property>

</configuration>