使用文檔格式轉換功能,您可以將支持的輸入文檔類型轉換為指定的輸出文檔類型,便于上層應用更好的使用文檔內容。
功能
將支持的輸入文檔類型轉換為指定的輸入文檔類型,格式轉換的輸出文檔保存在請求中指定的OSS路徑中。
目前支持的輸入文檔類型包含如下格式:
文字文檔:DOC、DOT、WPS、WPT、DOCX、DOTX、DOCM、DOTM
演示文檔:PPTX、PPT、POT、POTX、PPS、PPSX、DPS、DPT、PPTM、POTM、PPSM
表格文檔:XLS、XLT、ET、ETT、XLSX、XLTX、CSV、XLSB、XLSM、XLTM
其他格式文檔:PDF、LRC、C、CPP、H、ASM、S、JAVA、ASP、BAT、BAS、PRG、CMD、RTF、TXT、LOG、XML、HTM、HTML
目前支持的輸出文檔類型包含JPG、PNG、PDF、TXT、VECTOR格式。
根據請求中指定的輸出文檔類型會有不同的輸出內容,輸出內容示例的更多信息,請參見輸出內容示例。
對于JPG、PNG和VECTOR格式的輸出文檔類型,根據輸入文檔類型是否為表格文檔,輸出內容不同。
當輸入文檔類型為表格文檔時,按表格中的頁簽生成對應數量的文件夾后,再按預覽頁面大小生成對應數量的文件。
當輸入文檔類型為非表格文檔(例如文字文檔、演示文檔)時,按文檔樣式每頁生成一個文件。
對于PDF和TXT格式的輸出文檔類型,無論輸入文檔類型是否為表格文檔,直接生成一個文件。
使用
文檔格式轉換所需的時間依賴于文檔大小、文檔頁數、文檔字數等因素,典型情況下在秒級可以完成請求,但是大文件、多頁數、多字數的文檔可能需要幾十秒的時間。為了降低請求的應用等待時間,文檔格式轉換目前提供了異步請求接口。
您可以通過同步請求或者異步請求方式進行文檔格式轉換。
文檔格式轉換的同步請求接口為ConvertOfficeFormat。
文檔格式轉換的異步請求接口為CreateOfficeConversionTask。
輸出內容示例
如下以請求中指定輸出到OSS路徑/bucket1/imm-format-convert-tgt/session123/為例說明轉換為不同輸出文檔類型時的輸出內容。
輸出文檔類型為JPG格式
當輸入文檔類型為表格文檔時,輸出內容示例如下所示。其中s1和s2為根據表格文檔中的頁簽名稱生成的文件夾。
/bucket1/imm-format-convert-tgt/session123/s1/1.jpg
/bucket1/imm-format-convert-tgt/session123/s1/2.jpg
/bucket1/imm-format-convert-tgt/session123/s1/[...].jpg
/bucket1/imm-format-convert-tgt/session123/s2/1.jpg
/bucket1/imm-format-convert-tgt/session123/s2/2.jpg
/bucket1/imm-format-convert-tgt/session123/s2/[...].jpg
當輸入文檔類型為非表格文檔時,輸出內容示例如下所示。
/bucket1/imm-format-convert-tgt/session123/1.jpg
/bucket1/imm-format-convert-tgt/session123/2.jpg
輸出文檔類型為PNG格式
當輸入文檔類型為表格文檔時,輸出內容示例如下所示。其中s1和s2為根據表格文檔中的頁簽名稱生成的文件夾。
/bucket1/imm-format-convert-tgt/session123/s1/1.png
/bucket1/imm-format-convert-tgt/session123/s1/2.png
/bucket1/imm-format-convert-tgt/session123/s1/[...].png
/bucket1/imm-format-convert-tgt/session123/s2/1.png
/bucket1/imm-format-convert-tgt/session123/s2/2.png
/bucket1/imm-format-convert-tgt/session123/s2/[...].png
當輸入文檔類型為非表格文檔時,輸出內容示例如下所示。
/bucket1/imm-format-convert-tgt/session123/1.png
/bucket1/imm-format-convert-tgt/session123/2.png
輸出文檔類型為PDF格式,無論輸入文檔類型是否為表格文檔,輸出內容均相同,輸出內容示例為/bucket1/imm-format-convert-tgt/session123/1.pdf。
輸出文檔類型為TXT格式,無論輸入文檔類型是否為表格文檔,輸出內容均相同,輸出內容示例為/bucket1/imm-format-convert-tgt/session123/1.txt。
輸出文檔類型為VECTOR格式
當輸入文檔類型為表格文檔時,輸出內容示例如下所示。其中meta.json文檔是元數據,s1/meta.json是sheet1的元數據,s1/fp1.json、s1/fp2.json等文檔是sheet1每頁的渲染信息。
/bucket1/imm-format-convert-tgt/session123/doc/meta.json
/bucket1/imm-format-convert-tgt/session123/doc/s1/meta.json
/bucket1/imm-format-convert-tgt/session123/doc/s1/fp1.json
/bucket1/imm-format-convert-tgt/session123/doc/s1/fp2.json
/bucket1/imm-format-convert-tgt/session123/doc/s1/fp[...].json
/bucket1/imm-format-convert-tgt/session123/doc/s2/meta.json
/bucket1/imm-format-convert-tgt/session123/doc/s2/fp1.json
/bucket1/imm-format-convert-tgt/session123/doc/s2/fp2.json
/bucket1/imm-format-convert-tgt/session123/doc/s2/fp[...].json
當輸入文檔類型為非表格文檔時,輸出內容示例如下所示。其中meta.json文檔是元數據,fp1.json、fp2.json等文檔是每頁的渲染信息,I/1、I/2等文檔是渲染使用的具體內容。
/bucket1/imm-format-convert-tgt/session123/doc/meta.json
/bucket1/imm-format-convert-tgt/session123/doc/fp1.json
/bucket1/imm-format-convert-tgt/session123/doc/fp2.json
/bucket1/imm-format-convert-tgt/session123/doc/fp[...].json
/bucket1/imm-format-convert-tgt/session123/doc/I/1
/bucket1/imm-format-convert-tgt/session123/doc/I/2
/bucket1/imm-format-convert-tgt/session123/doc/I/[...]