Powered by GitBook

探索数据

样本数据集编辑

现在，我们已经获得了基本的一瞥，让我们尝试在更真实的数据集下工作。我准备了虚构的JSON文档样本的客户银行账户信息。每个文档有以下模式：

{
    "account_number": 0,
    "balance": 16623,
    "firstname": "Bradshaw",
    "lastname": "Mckenzie",
    "age": 29,
    "gender": "F",
    "address": "244 Columbus Place",
    "employer": "Euron",
    "email": "bradshawmckenzie@euron.com",
    "city": "Hobucken",
    "state": "CO"
}

出于好奇，我从www.json-generator.com/生成该数据，所以请忽略实际值和数据，因为这些语义都是随机生成的。

加载样本数据集

您可以从这里下载示例数据集（accounts.json）。它解压到我们当前的目录，让我们把它加载到我们的集群如下：

curl -XPOST 'localhost:9200/bank/account/_bulk?pretty' --data-binary "@accounts.json"
curl 'localhost:9200/_cat/indices?v'

然后返回:

curl 'localhost:9200/_cat/indices?v'
health index pri rep docs.count docs.deleted store.size pri.store.size
yellow bank    5   1       1000            0    424.4kb        424.4kb

这意味着我们刚刚成功地批量索引文件1000条到银行索引（在account类型下）。

results matching ""

No results matching ""