跳到主要內容

HDFS MapFile



前面說明了SequenceFile,而在這裡要介紹MapFile,可以說是索引版及排序後的SequenceFile,MapFile由兩個部分組成,分別是data與index,index就是存放索引的文件,當透過Mapfile來訪問文件時,index文件將被載入到內存,藉由索引快速定位到指定Record所在位置,因此提高了檢索效率。
一、API的部分基本上都與SequenceFil相同,只是從SequenceFile類轉換成MapFile類,另外讀取的部分雖可用相同的方式讀取,但MapFile可以藉由索引,直接對指定的key作抓取的動作,而不需要再循序。
二、實際撰寫API
     (一)首先一樣寫一個writeToMap的方法


public void writeToMap(String srcPath, MapFile.Writer writer, Text writableKey, BytesWritable writableValue){
    InputStream in = null;
    try {
        in = new BufferedInputStream(new FileInputStream(srcPath));
        String fileName = srcPath.substring(srcPath.lastIndexOf("\\") + 1);
        writableKey.set(fileName);
        int len = 0;
        byte[] buff = new byte[in.available()];
        while ((len = in.read(buff))!= -1) {
            writableValue.set(buff, 0, len);
            writer.append(writableKey, writableValue);//將每筆資訊追加到MapFile.Writer的尾端
        }
    } catch (IOException e) {
        e.printStackTrace();
    }finally {
        IOUtils.closeStream(in);
    }
}

    (二)撰寫uploadToMap將指定目錄下的所有檔案以打包方式上傳至HDFS

public void uploadToMap(String srcDir,String desc){
    MapFile.Writer writer = null;
    try {
        FileSystem fileSystem = FileSystem.get(conf);
        Text writableKey = new Text();
        BytesWritable writableValue = new BytesWritable();
        writer  = new MapFile.Writer(conf,fileSystem,desc,writableKey.getClass(),writableValue.getClass());
        File folder = new File(srcDir);
        String[] list = folder.list();
        for (int i = 0; i < list.length; i++) {
            String filePath = srcDir + "\\" + list[i];
            writeToMap(filePath, writer, writableKey, writableValue);
        }
    } catch (IOException e) {
        e.printStackTrace();
    } catch (Exception e) {
        e.printStackTrace();
    }finally {
        IOUtils.closeStream(writer);
    }
}

    (三)撰寫downloadFromMap進行下載

public void downloadFromMap(String srcDir,String desc,String fileName){
    MapFile.Reader reader = null;
    try {
        FileSystem fileSystem = FileSystem.get(conf);
        OutputStream out = new BufferedOutputStream(new FileOutputStream(desc));
        Text writableKey = new Text(fileName);
        BytesWritable writableValue =  new BytesWritable();
        reader = new MapFile.Reader(new Path(srcDir),conf);
        reader.get(writableKey,writableValue);//使用reader.get直接跳到該位置
        out.write(writableValue.getBytes(),0,writableValue.getLength());
        out.flush();
    } catch (IOException e) {
        e.printStackTrace();
    }finally {
        IOUtils.closeStream(reader);
    }
}

    (四)最後實際使用上傳及下載的方法

public static void main(String[] args) {
    final String HDFS_PATH = "hdfs://192.168.121.130:9000";
    MapFileOperation mapFile = new MapFileOperation(HDFS_PATH);
    mapFile.uploadToMap("C:\\Users\\will\\Downloads\\myTestFiles","/testFile/test.map");
    mapFile.downloadFromMap("/testFile/test.map","C:\\Users\\will\\Downloads\\7.pdf","7.pdf");
}

留言

這個網誌中的熱門文章

java西元民國轉換_各種不同格式

C#資料庫操作(新增、修改、刪除、查詢)

【Excel好好玩】 自己的資產自己管!善用Google Sheet來幫我們評估貸款

這次介紹的主題是關於Excel的貸款還款計畫試算,我們人生中總會遇到需要大筆金額的花費,但當資金不夠時就得進行貸款,而貸款之前如果我們能夠審慎評估,並分析自己的還款能力之後在進行凍作,相信風險會小很多,因此就自己動動手來使用Google Sheet進行試算吧! 基本資料 ● 貸款總額: 1000000 ● 貸款期數: 84月 ● 年利率: 2.11% ● 月利率: 0.18% P.S 月利率 = 年利率 / 12 重要函式 PMT : 這是Google Sheet內建的重要年金計算公式,我們可以善用這個公式來計算固定利率及期數的固定攤還本息。因為PMT函式計算出的結果為負數,所以前面加上-號轉成正數。 動手做 首先我們在Excel表上列出我們的基本資料 圖片來源 其中月利率的部分就使用公式「=B4/12」 接著我們填上第一列的期數跟餘額 圖片來源 =B2 =B3 使用關鍵PMT函數來計算本息的部分 因為PMT函式計算出的結果為負數,所以前面加上-號轉成正數。 -PMT(貸款利率(月利率), 貸款期數, 貸款總額) =-PMT($B$5,$B$3,$B$2) 圖片來源 計算利息 利息 = 貸款餘額 x 月利率 =B8*$B$5 圖片來源 計算本金 本金 = 本息 - 利息 =C8-D8 圖片來源 製作第二列餘額的部分 餘額的部分 = 上一期的餘額 - 上一期的本金 圖片來源 接著拖曳該兩列往下拉,即可查看每一期的利息與本金 圖片來源 結語 雖然市面上已經有很多貸款銀行都提供了試算功能,但如果我們想要進一步管理自己的資產時,就需要將每一期的金額給計算出來,因此才會將公式運用在Excel表,讓我們的資產管理表能夠結合負債,進一步評估我們理財行動的下一步,希望這樣的經驗可以幫助到正在理財道路上打拼的夥伴,讓我們透過有效的管理,幫助荷包長大吧! 喜歡撰寫文章的你,不妨來了解一下: Web3.0時代下為創作者、閱讀者打造的專屬共贏平台 — 為什麼要加入? 歡迎加入一起練習寫作,賺取知識,累積財富!