探索数据
样本数据集编辑
现在,我们已经获得了基本的一瞥,让我们尝试在更真实的数据集下工作。我准备了虚构的JSON文档样本的客户银行账户信息。每个文档有以下模式:
{
"account_number": 0,
"balance": 16623,
"firstname": "Bradshaw",
"lastname": "Mckenzie",
"age": 29,
"gender": "F",
"address": "244 Columbus Place",
"employer": "Euron",
"email": "[email protected]",
"city": "Hobucken",
"state": "CO"
}
出于好奇,我从www.json-generator.com/生成该数据,所以请忽略实际值和数据,因为这些语义都是随机生成的。
加载样本数据集
您可以从这里下载示例数据集(accounts.json)。它解压到我们当前的目录,让我们把它加载到我们的集群如下:
curl -XPOST 'localhost:9200/bank/account/_bulk?pretty' --data-binary "@accounts.json"
curl 'localhost:9200/_cat/indices?v'
然后返回:
curl 'localhost:9200/_cat/indices?v'
health index pri rep docs.count docs.deleted store.size pri.store.size
yellow bank 5 1 1000 0 424.4kb 424.4kb
这意味着我们刚刚成功地批量索引文件1000条到银行索引(在account类型下)。