探索你的数据
样本数据集
现在我们得到了基本的一瞥,我们现在试着在更多的现实数据集上工作。我已经准备了一个虚构的JSON文档,这个文档描述了顾客的银行账户信息。每个文档都有下面这些数据:
{
"account_number": 0,
"balance": 16623,
"firstname": "Bradshaw",
"lastname": "Mckenzie",
"age": 29,
"gender": "F",
"address": "244 Columbus Place",
"employer": "Euron",
"email": "[email protected]",
"city": "Hobucken",
"state": "CO"
}
出于好奇,我从 www.json-generator.com/ 生成了这些数据。所以,请忽视真实的值和数据的语义,它们都是随机生成的。
加载样本数据
你可以从这里下载样本数据集。解压到当前目录,并像下面一样加载到我们的集群中去:
curl -XPOST 'localhost:9200/bank/account/_bulk?pretty' --data-binary "@accounts.json"
curl 'localhost:9200/_cat/indices?v'
响应为:
curl 'localhost:9200/_cat/indices?v'
health index pri rep docs.count docs.deleted store.size pri.store.size
yellow bank 5 1 1000 0 424.4kb 424.4kb
这意味着我们成功地索引了1000个文档到我们的bank索引中。