答案:1.文本挖掘处理的是大规模的文本集合,而不是一个或少量的文本文档。2.文本挖掘发现的知识是隐藏在大量文本文档中的,是新的、以前未知的模式或关系。3.文本挖掘抽取的知识是以真实世界为基础的、具有潜在价值的、是直接可用的,它或者是某个特定用户感兴趣的,或者对于解答某个特定问题是有用的。4.由于文本挖掘处理的是大规模的文本库,其挖掘算法复杂度必须在时间和空间上是多项式的。5.文本数据有大量的噪声和不规则的结构,因此文本挖掘算法应具有很强的算法鲁棒性。6.文本挖掘是个多学科交叉的研究领域,涉及领域包括数据挖掘,机器学习,统计学,自然语言理解,信息检索,信息抽取,聚类,可视化,数据库技术等。