重要
本文档已过时,将来可能不会更新。
此信息适用于旧版 Databricks CLI 0.18 及更低版本。 Databricks 建议改用较新的 Databricks CLI 0.205 或更高版本。 请参阅什么是 Databricks CLI?。 若要查找你的 Databricks CLI 的版本,请运行 databricks -v。
若要从 Databricks CLI 版本 0.18 或更低版本迁移到 Databricks CLI 版本 0.205 或更高版本,请参阅 Databricks CLI 迁移。
运行 Databricks DBFS CLI 子命令,将其追加到 databricks fs(或别名 dbfs),并在所有 DBFS 路径前加上 dbfs:/。 这些子命令调用 DBFS API。
databricks fs -h
Usage: databricks fs [OPTIONS] COMMAND [ARGS]...
Utility to interact with DBFS. DBFS paths are all prefixed
with dbfs:/. Local paths can be absolute or local.
Options:
-v, --version
-h, --help Show this message and exit.
Commands:
cat Shows the contents of a file. Does not work for directories.
configure
cp Copies files to and from DBFS.
Options:
-r, --recursive
--overwrite Overwrites files that exist already.
ls Lists files in DBFS.
Options:
--absolute Displays absolute paths.
-l Displays full information including size and file type.
mkdirs Makes directories in DBFS.
mv Moves a file between two DBFS paths.
rm Removes files from DBFS.
Options:
-r, --recursive
对于列出、移动或删除超过 1 万个文件的操作,强烈建议不要使用 DBFS CLI。
list操作 (databricks fs ls) 会在大约 60 秒后超时。move操作 (databricks fs mv) 会在大约 60 秒后超时,可能导致只有一部分数据被移动。delete操作 (databricks fs rm) 会以增量方式删除成批的文件。
建议使用文件系统实用工具 (dbutils.fs) 在群集的上下文中执行此类操作。 dbutils.fs 涵盖 DBFS REST API 的功能范围,但仅限笔记本内部。 使用笔记本运行此类操作可提供更好的控制(例如选择性删除)和可管理性,并可自动执行定期作业。
限制
不支持将 Databricks DBFS CLI 用于启用了防火墙的存储容器。 Databricks 建议使用 Databricks Connect 或 az storage。
列出文件内容
若要显示使用情况文档,请运行 databricks fs cat --help。
databricks fs cat dbfs:/tmp/my-file.txt
Apache Spark is awesome!
复制文件
若要显示使用情况文档,请运行 databricks fs cp --help。
databricks fs cp dbfs:/tmp/your_file.txt dbfs:/parent/child/grandchild/my_file.txt --overwrite
成功后,此命令不会显示任何内容。
列出有关文件和目录的信息
若要显示使用情况文档,请运行 databricks fs ls --help。
databricks fs ls dbfs:/tmp --absolute -l
file 42408084 dbfs:/tmp/LoanStats.csv 1590005159000
file 40 dbfs:/tmp/file_b.txt 1603991038000
dir 0 dbfs:/tmp/hive 0
dir 0 dbfs:/tmp/mlflow 0
file 385 dbfs:/tmp/multi-line.json 1597770632000
dir 0 dbfs:/tmp/new 0
dir 0 dbfs:/tmp/parent 0
file 243 dbfs:/tmp/test.json 1597770628000
file 40 dbfs:/tmp/test_dbfs.txt 1603989162000
创建目录
若要显示使用情况文档,请运行 databricks fs mkdirs --help。
databricks fs mkdirs dbfs:/tmp/new-dir
成功后,此命令不会显示任何内容。
移动文件
若要显示使用情况文档,请运行 databricks fs mv --help。
databricks fs mv dbfs:/tmp/my-file.txt dbfs:/parent/child/grandchild/my-file.txt
成功后,此命令不会显示任何内容。
删除文件
若要显示使用情况文档,请运行 databricks fs rm --help。
databricks fs rm dbfs:/tmp/parent/child/grandchild/my-file.txt
Delete finished successfully.