• 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏吧

标签:dataset

dataset

在收据上使用Tesseract时如何获得更好的结果?

在收据上使用Tesseract时如何获得更好的结果?
我正在用Java开发一个可扫描收据的应用程序,并使用带有tesseract库的OCR提取所有文本。我已经在2张图像上运行了该程序,一张是我拍摄的,另一张是来自互联网的,而从互联网上获得的效果几乎是完美的,但是从我的图片中得到了随机字符串。我该如何改变呢?我需要高分辨率的高品质图像吗? 我试图拍摄更好的图像,甚至只用一个字就能拍到的图像,但我什么都没得到。 T……继续阅读 »

dataset

Hadoop-MapReduce的小型数据集

Hadoop-MapReduce的小型数据集
我正在尝试熟悉Hadoop-MapReduce。在研究了有关该概念的理论知识之后,我想对它们进行练习。 但是,我找不到该技术的小型数据集(最大3 Gb)。在哪里可以找到数据集以便进行练习? 或者,我该如何练习Hadoop-MapReduce?换句话说,有没有提供练习的教程或网站? 解决方案如下: 可公开访问的数据集,您可以下载并使用它们。以下是一个几……继续阅读 »

dataset

Java + Hadoop + NoSql(使用什么组合)

Java + Hadoop + NoSql(使用什么组合)
我对此并不陌生,我的要求如下:我想处理电影分级(文本格式)的巨大文本数据集,并将其存储在某些NoSQL数据库中,然后进行一些处理并推荐给定一部特定电影的电影。 所以我需要速度-我认为Hadoop会在这方面为我提供帮助,并将数据保留在NoSQL数据库中会进一步提高速度。我想知道其他一些方法是否众所周知,以及Java与哪些组合一起使用 谢谢 解决方案如下: ……继续阅读 »

data-mining

需要帮助来为恶意网址的数据集创建mapreduce

需要帮助来为恶意网址的数据集创建mapreduce
我正在完成我的最后一个项目,我们必须创建一个应用程序来检测恶意URL。我们必须在所有网址之间找到模式。我们有一个很大的数据集,需要很长时间才能将一个URL与其他URL进行匹配。 现在我们正在考虑将项目移至hadoop,但是我们没有获得如何为Java项目和数据集进行mapreduce并将其移至hadoop的方法。 请帮助我们为程序和数据集创建mapreduce……继续阅读 »

assertion

关于dbunit中的列类型和为数据集创建dtd的困惑

关于dbunit中的列类型和为数据集创建dtd的困惑
对于使用dbunit的帮助,我将不胜感激。我使用postgresql9作为数据库。 我使用休眠的hbm2ddl工具创建了表格书。 我想创建一些xmldatasets用于dbunit的测试。使用ant DBUnit任务,我将值从db导出到了initialdataset.xml,我在每次测试前都会将其干净地插入db。删除一些行后,我创建了期望的dataset.x……继续阅读 »