csdn存储大量数据(开源数据什么意思)

fhuyi0XCV 精选 2024-04-10 4 0

一、数据挖掘算法有哪些

问题一：常用的数据挖掘算法有哪几类？ 10分有十大经典算法：我是看谭磊的那本书学的。。。

下面是网站给出的答案：

1. C4.5

C4.5算法是机器学习算法中的一种分类决策树算法,其核心算法是ID3算法. C4.5算法继承了ID3算法的优点，并在以下几方面对ID3算法进行了改进：

1)用信息增益率来选择属性，克服了用信息增益选择属性时偏向选择取值多的属性的不足；

2)在树构造过程中进行剪枝；

3)能够完成对连续属性的离散化处理；

4)能够对不完整数据进行处理。

C4.5算法有如下优点：产生的分类规则易于理解，准确率较高。其缺点是：在构造树的过程中，需要对数据集进行多次的顺序扫描和排序，因而导致算法的低效。

2. The k-means algorithm即K-Means算法

k-means algorithm算法是一个聚类算法，把n的对象根据他们的属性分为k个分割，k>

问题二：数据挖掘中的预测算法有哪些数据挖掘（六）：预测

blog.csdn/...977837

问题三：用于数据挖掘的分类算法有哪些，各有何优劣朴素贝叶斯(Naive Bayes, NB)

超级简单，就像做一些数数的工作。如果条件独立假设成立的话，NB将比鉴别模型（如Logistic回归）收敛的更快，所以你只需要少量的训练数据。即使条件独立假设不成立，NB在实际中仍然表现出惊人的好。如果你想做类似半监督学习，或者是既要模型简单又要性能好，NB值得尝试。

Logistic回归(Logistic Regression, LR)

LR有很多方法来对模型正则化。比起NB的条件独立性假设，LR不需要考虑样本是否是相关的。与决策树与支持向量机（SVM）不同，NB有很好的概率解释，且很容易利用新的训练数据来更新模型（使用在线梯度下降法）。如果你想要一些概率信息（如，为了更容易的调整分类阈值，得到分类的不确定性，得到置信区间），或者希望将来有更多数据时能方便的更新改进模型，LR是值得使用的。

决策树（Decision Tree, DT）

DT容易理解与解释（对某些人而言――不确定我是否也在他们其中）。DT是非参数的，所以你不需要担心野点（或离群点）和数据是否线性可分的问题（例如，DT可以轻松的处理这种情况：属于A类的样本的特征x取值往往非常小或者非常大，而属于B类的样本的特征x取值在中间范围）。DT的主要缺点是容易过拟合，这也正是随机森林（Random Forest, RF）（或者Boosted树）等集成学习算法被提出来的原因。此外，RF在很多分类问题中经常表现得最好（我个人相信一般比SVM稍好），且速度快可扩展，也不像SVM那样需要调整大量的参数，所以最近RF是一个非常流行的算法。

支持向量机（Support Vector Machine, SVM）

很高的分类正确率，对过拟合有很好的理论保证，选取合适的核函数，面对特征线性不可分的问题也可以表现得很好。SVM在维数通常很高的文本分类中非常的流行。由于较大的内存需求和繁琐的调参，我认为RF已经开始威胁其地位了。

回到LR与DT的问题（我更倾向是LR与RF的问题），做个简单的总结：两种方法都很快且可扩展。在正确率方面，RF比LR更优。但是LR可以在线更新且提供有用的概率信息。鉴于你在Square(不确定推断科学家是什么，应该不是有趣的化身)，可能从事欺诈检测：如果你想快速的调整阈值来改变假阳性率与假阴性率，分类结果中包含概率信息将很有帮助。无论你选择什么算法，如果你的各类样本数量是不均衡的（在欺诈检测中经常发生），你需要重新采样各类数据或者调整你的误差度量方法来使各类更均衡。

问题四：数据挖掘与算法是什么关系？ data mining：数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性（属于Association rule learning）的信息的过程。reference:数据挖掘2.聚类和分类：关于这些，我相信再好的算法，都会有一定的准确度，我没有说这些东西不重要。3.如果你的数据量足够大，举个例子说明吧，数据挖掘是这样做的，你要判断什么样的苹果是甜的，应该这样做，去超市买苹果，总结甜苹果的特征 A B，第二次你也去买苹果，就选具备这些特征值的。存的的问题有可能买到的苹果还不是甜的，可能原因是要同时包含特征C。但是如果你数据量足够大，足够大，你要买的苹果直接能够找到，一模一样的苹果，是不是甜的，都已经知道啦，直接取出来不就好了吗？前提是数据你想要什么有什么。@黄宇恒@肖智博@葛少华@余天升

问题五：数据挖掘的方法有哪些？利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等，它们分别从不同的角度对数据进行挖掘。1、分类分类是找出数据库中一组数据对象的共同特点并按照分类模式将其划分为不同的类，其目的是通过分类模型，将数据库中的数据项映射到某个给定的类别。它可以应用到客户的分类、客户的属性和特征分析、客户满意度分析、客户的购买趋势预测等，如一个汽车零售商将客户按照对汽车的喜好划分成不同的类，这样营销人员就可以将新型汽车的广告手册直接邮寄到有这种喜好的客户手中，从而大大增加了商业机会。2、回归分析回归分析方法反映的是事务数据库中属性值在时间上的特征，产生一个将数据项映射到一个实值预测变量的函数，发现变量或属性间的依赖关系，其主要研究问题包括数据序列的趋势特征、数据序列的预测以及数据间的相关关系等。它可以应用到市场营销的各个方面，如客户寻求、保持和预防客户流失活动、产品生命周期分析、销售趋势预测及有针对性的促销活动等。3、聚类聚类分析是把一组数据按照相似性和差异性分为几个类别，其目的是使得属于同一类别的数据间的相似性尽可能大，不同类别中的数据间的相似性尽可能小。它可以应用到客户群体的分丹、客户背景分析、客户购买趋势预测、市场的细分等。4、关联规则关联规则是描述数据库中数据项之间所存在的关系的规则，即根据一个事务中某些项的出现可导出另一些项在同一事务中也出现，即隐藏在数据间的关联或相互关系。在客户关系管理中，通过对企业的客户数据库里的大量数据进行挖掘，可以从大量的记录中发现有趣的关联关系，找出影响市场营销效果的关键因素，为产品定位、定价与定制客户群，客户寻求、细分与保持，市场营销与推销，营销风险评估和诈骗预测等决策支持提供参考依据。5、特征特征分析是从数据库中的一组数据中提取出关于这些数据的特征式，这些特征式表达了该数据集的总体特征。如营销人员通过对客户流失因素的特征提取，可以得到导致客户流失的一系列原因和主要特征，利用这些特征可以有效地预防客户的流失。6、变化和偏差分析偏差包括很大一类潜在有趣的知识，如分类中的反常实例，模式的例外，观察结果对期望的偏差等，其目的是寻找观察结果与参照量之间有意义的差别。在企业危机管理及其预警中，管理者更感兴趣的是那些意外规则。意外规则的挖掘可以应用到各种异常信息的发现、分析、识别、评价和预警等方面。7、Web页挖掘随着Internet的迅速发展及Web的全球普及，使得Web上的信息量无比丰富，通过对Web的挖掘，可以利用Web的海量数据进行分析，收集政治、经济、政策、科技、金融、各种市场、竞争对手、供求信息、客户等有关的信息，集中精力分析和处理那些对企业有重大或潜在重大影响的外部环境信息和内部经营信息，并根据分析结果找出企业管理过程中出现的各种问题和可能引起危机的先兆，对这些信息进行分析和处理，以便识别、分析、评价和管理危机。

问题六：数据挖掘中常见的分类方法有哪些判别分析、规则归纳、决策树、神经网络、K最近邻、基于案例的推理、遗传算法等等挺多的，这个问题范围太大了，云速数据挖掘分类挺多。

问题七：数据挖掘的方法有哪些利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等，它们分别从不同的角度对数据进行挖掘。

1、分类

分类是找出数据库中一组数据对象的共同特点并按照分类模式将其划分为不同的类，其目的是通过分类模型，将数据库中的数据项映射到某个给定的类别。它可以应用到客户的分类、客户的属性和特征分析、客户满意度分析、客户的购买趋势预测等，如一个汽车零售商将客户按照对汽车的喜好划分成不同的类，这样营销人员就可以将新型汽车的广告手册直接邮寄到有这种喜好的客户手中，从而大大增加了商业机会。

2、回归分析

回归分析方法反映的是事务数据库中属性值在时间上的特征，产生一个将数据项映射到一个实值预测变量的函数，发现变量或属性间的依赖关系，其主要研究问题包括数据序列的趋势特征、数据序列的预测以及数据间的相关关系等。它可以应用到市场营销的各个方面，如客户寻求、保持和预防客户流失活动、产品生命周期分析、销售趋势预测及有针对性的促销活动等。

3、聚类

聚类分析是把一组数据按照相似性和差异性分为几个类别，其目的是使得属于同一类别的数据间的相似性尽可能大，不同类别中的数据间的相似性尽可能小。它可以应用到客户群体的分类、客户背景分析、客户购买趋势预测、市场的细分等。

4、关联规则

关联规则是描述数据库中数据项之间所存在的关系的规则，即根据一个事务中某些项的出现可导出另一些项在同一事务中也出现，即隐藏在数据间的关联或相互关系。在客户关系管理中，通过对企业的客户数据库里的大量数据进行挖掘，可以从大量的记录中发现有趣的关联关系，找出影响市场营销效果的关键因素，为产品定位、定价与定制客户群，客户寻求、细分与保持，市场营销与推销，营销风险评估和诈骗预测等决策支持提供参考依据。

5、特征

特征分析是从数据库中的一组数据中提取出关于这些数据的特征式，这些特征式表达了该数据集的总体特征。如营销人员通过对客户流失因素的特征提取，可以得到导致客户流失的一系列原因和主要特征，利用这些特征可以有效地预防客户的流失。

6、变化和偏差分析

偏差包括很大一类潜在有趣的知识，如分类中的反常实例，模式的例外，观察结果对期望的偏差等，其目的是寻找观察结果与参照量之间有意义的差别。在企业危机管理及其预警中，管理者更感兴趣的是那些意外规则。意外规则的挖掘可以应用到各种异常信息的发现、分析、识别、评价和预警等方面。

7、Web页挖掘

随着Internet的迅速发展及Web的全球普及，使得Web上的信息量无比丰富，通过对Web的挖掘，可以利用Web的海量数据进行分析，收集政治、经济、政策、科技、金融、各种市场、竞争对手、供求信息、客户等有关的信息，集中精力分析和处理那些对企业有重大或潜在重大影响的外部环境信息和内部经营信息，并根据分析结果找出企业管理过程中出现的各种问题和可能引起危机的先兆，对这些信息进行分析和处理，以便识别、分析、评价和管理危机。

问题八：用于数据挖掘的分类算法有哪些，各有何数据挖掘可以看看【云速数据挖掘】，全中文界面，只要设置好挖掘的熟悉，什么信息都能挖掘到

问题九：大数据挖掘常用的方法有哪些在大数据时代，数据挖掘是最关键的工作。大数据的挖掘是从海量、不完全的、有噪声的、模糊的、随机的大型数据库中发现隐含在其中有价值的、潜在有用的信息和知识的过程，也是一种决策支持过程。其主要基于人工智能，机器学习，模式学习，统计学等。通过对大数据高度自动化地分析，做出归纳性的推理，从中挖掘出潜在的模式，可以帮助企业、商家、用户调整市场政策、减少风险、理性面对市场，并做出正确的决策。目前，在很多领域尤其是在商业领域如银行、电信、电商等，数据挖掘可以解决很多问题，包括市场营销策略制定、背景分析、企业管理危机等。大数据的挖掘常用的方法有分类、回归分析、聚类、关联规则、神经网络方法、Web数据挖掘等。这些方法从不同的角度对数据进行挖掘。

(1)分类。分类是找出数据库中的一组数据对象的共同特点并按照分类模式将其划分为不同的类，其目的是通过分类模型，将数据库中的数据项映射到摸个给定的类别中。可以应用到涉及到应用分类、趋势预测中，如淘宝商铺将用户在一段时间内的购买情况划分成不同的类，根据情况向用户推荐关联类的商品，从而增加商铺的销售量。

(2)回归分析。回归分析反映了数据库中数据的属性值的特性，通过函数表达数据映射的关系来发现属性值之间的依赖关系。它可以应用到对数据序列的预测及相关关系的研究中去。在市场营销中，回归分析可以被应用到各个方面。如通过对本季度销售的回归分析，对下一季度的销售趋势作出预测并做出针对性的营销改变。

(3)聚类。聚类类似于分类，但与分类的目的不同，是针对数据的相似性和差异性将一组数据分为几个类别。属于同一类别的数据间的相似性很大，但不同类别之间数据的相似性很小，跨类的数据关联性很低。

(4)关联规则。关联规则是隐藏在数据项之间的关联或相互关系，即可以根据一个数据项的出现推导出其他数据项的出现。关联规则的挖掘过程主要包括两个阶段：第一阶段为从海量原始数据中找出所有的高频项目组;第二极端为从这些高频项目组产生关联规则。关联规则挖掘技术已经被广泛应用于金融行业企业中用以预测客户的需求，各银行在自己的ATM机上通过捆绑客户可能感兴趣的信息供用户了解并获取相应信息来改善自身的营销。

(5)神经网络方法。神经网络作为一种先进的人工智能技术，因其自身自行处理、分布存储和高度容错等特性非常适合处理非线性的以及那些以模糊、不完整、不严密的知识或数据为特征的处理问题，它的这一特点十分适合解决数据挖掘的问题。典型的神经网络模型主要分为三大类：第一类是以用于分类预测和模式识别的前馈式神经网络模型，其主要代表为函数型网络、感知机;第二类是用于联想记忆和优化算法的反馈式神经网络模型，以Hopfield的离散模型和连续模型为代表。第三类是用于聚类的自组织映射方法，以ART模型为代表。虽然神经网络有多种模型及算法，但在特定领域的数据挖掘中使用何种模型及算法并没有统一的规则，而且人们很难理解网络的学习及决策过程。

(6)Web数据挖掘。Web数据挖掘是一项综合性技术，指Web从文档结构和使用的*** C中发现隐含的模式P，如果将C看做是输入，P看做是输出，那么Web挖掘过程就可以看做是从输入到输出的一个映射过程。

当前越来越多的Web数据都是以数据流的形式出现的，因此对Web数据流挖掘就具有很重要的意义。目前常用的Web数据挖掘算法有：PageRank算法，HITS算法以及LOGSOM算法。这三种算法提到的用户都是笼统的用户，并没有区分用户的个体。目前Web数据挖掘面临着一些问题，包括：用户的分类问题、网站内容时效性问题，用户在页面......>>

二、开源数据什么意思

问题一：开源数据库是什么??作用是什么？做网站的吗？？开源意思是开放源代码，没有加密

开源数据库，说明这个数据库没有加密的，代码就是开放的

数据库作用都是用于动态语言开发的网站

问题二：四大开源数据库是哪些开源世界中的那几个免费数据库

发布时间：2011-11-22 09:34:30来源：CSDN评论：0点击：1476次【字号：大中小】

QQ空间新浪微博腾讯微博人人网豆瓣网百度空间百度搜藏开心网复制更多 0

开源数据库MySQLMySQL是一个开放源码的小型关联式数据库管理系统，开发者为瑞典MySQL AB公司。目前MySQL被广泛地应用在Internet上的中小型网站中。由于其体积小、速度快、总体拥有成本低，尤其是开放源...

开源数据库MySQL

MySQL是一个开放源码的小型关联式数据库管理系统，开发者为瑞典MySQL AB公司。目前MySQL被广泛地应用在Internet上的中小型网站中。由于其体积小、速度快、总体拥有成本低，尤其是开放源码这一特点，许多中小型网站为了降低网站总体拥有成本而选择了MySQL作为网站数据库。

盘点：开源社区那些免费的数据库软件

MySQL为多种编程语言提供了API，包括C、C++、C#、Delphi、Eiffel、Java、Perl、PHP、Python、Ruby和Tcl等。而其自身是采用C和C++编写的，使用了多种编译器进行测试，所以，MySQL能够保证源代码具有很强的可移植性。这样的一款数据库，自然能够支持几乎所有的操作系统，从Unix、Linux到Windows，具体包括AIX、BSDi、FreeBSD、HP-UX、Linux、Mac OS、Novell Netware、NetBSD、OpenBSD、OS/2 Wrap、Solaris、SunOS、Windows等多种操作系统。最重要的是，它是一个可以处理拥有上千万条记录的大型数据库。

与此同时，MySQL也产生了很多分支版本的数据库也非常值得推荐。

首先是MariaDB，它是一个采用Maria存储引擎的MySQL分支版本，是由原来MySQL的作者 Michael Widenius创办的公司所开发的免费开源的数据库服务器。与MySQL相比较，MariaDB更强的地方在于它拥有更多的引擎，包括Maria存储引擎、PBXT存储引擎、XtraDB存储引擎、FederatedX存储引擎，它能够更快的复制查询处理、运行的速度更快、更好的功能测试以及支持对Unicode的排序等。

其次是rcona，它为MySQL数据库服务器进行了改进，在功能和性能上较MySQL有着很显著的提升。该版本提升了在高负载情况下的InnoDB的性能，同时，它还为DBA提供一些非常有用的性能诊断工具，并且提供很多参数和命令来控制服务器行为。

第三是Percona Server，它使用了诸如google-mysql-tools、Proven Scaling和 Open Query对MySQL进行改造。并且，它只包含MySQL的服务器版，并没有提供相应对 MySQL的Connector和GUI工具进行改进。

非关系型数据库NoSQL

从NoSQL的字面上理解，NoSQL就是Not Only SQL，被业界认为是一项全新的数据库革命性运动，早期就有人提出，发展至2009年趋势越发高涨。NoSQL的拥护者们提倡运用非关系型的数据存储，相对于目前铺天盖地的关系型数据库运用，这一概念无疑是一种全新的思维的注入。

盘点：开源社区那些免费的数据库软件

当然，NoSQL也是随着互联网Web2.0网站的兴起才能取得长足的进步。关键的需求在于，传统的关系数据库在应付Web2.0网站，特......>>

问题三：什么是开源数据库开源意思是开放源代码，没有加密

开源数据库，说明这个数据库没有加密的，代码就是开放的

数据库作用都是用于动态语言开发的网站

问题四：什么是开源大数据技术？即数据量极为庞大，数据体结构并不清晰，冗余数据多。

大数据技术利用这些数据，以更快的速度和更好的逻辑清洗分析这些数据。以及通过一些算法，挖掘出这些庞杂数据中有价值的部分，为公司提供关系效益的新的隐蔽参数，并提供科学指导。

开源，就是开放源码，意味着免费和自由的进行二次开发，如当下最为广泛使用的hadoop生态系统。

问题五：该选择哪个开源数据库关系型mysql

非关系型mongodb

问题六：数据源是什么意思图表数据源（Data Source）是提供某种所需要数据的器件或原始媒体。信息系统的数据源必需可靠且具备更新能力，目前常用的数据源有：①观测数据，即现场获取的实测数据，它们包括野外实地勘测、量算数据，台站的观测记录数据，遥测数据等。②分析测定数据，即利用物理和化学方法分析测定的数据。③图形数据，各种地形图和专题地图等。④统计调查数据，各种类型的统计报表、社会调查数据等。⑤遥感数据，由地面、航空或航天遥感获得的数据。目前，中国的数据源数量庞大。如：全国范围的土地资源清查及详查数据，航空摄影测量图像和国土普查卫星资料已覆盖全国，定位、半定位观测站网遍布全国，有地面调查、地图测绘等大量数据。

上面提到的数据源例子只是很小一部分，事实上数据源可以是任何数据类型。

问题七：现在的开源图形数据库有哪些首先是MariaDB，它是一个采用Maria存储引擎的MySQL分支版本，是由原来MySQL的作者 Michael Widenius创办的公司所开发的免费开源的数据库服务器。与MySQL相比较，MariaDB更强的地方在于它拥有更多的引擎，包括Maria存储引擎、PBXT存储引擎、XtraDB存储引擎、FederatedX存储引擎，它能够更快的复制查询处理、运行的速度更快、更好的功能测试以及支持对Unicode的排序等。

问题八：该选择哪个开源数据库？哪一个更好 Access是一种桌面数据库，只适合数据量少的应用，在处理少量数据和单机访问的数据库时是很好的，效率也很高。但是它的同时访问客户端不能多于4个。Microsoft Access数据库有一定的极限，如果数据达到100M左右，很容易造成服务器iis假死，或者消耗掉服务器的内存导致服务器崩溃，表现为英文“Service Unavailable”。

MS SQL Server是基于服务器端的中型的数据库，可以适合大容量数据的应用，在功能上管理上也要比Microsoft Access要强得多。在处理海量数据的效率，后台开发的灵活性，可扩展性等方面强大。因为现在数据库都使用标准的SQL语言对数据库进行管理，所以如果是标准SQL语言，两者基本上都可以通用的。Microsoft SQL Server还有更多的扩展，可以用存储过程，数据库大小无极限限制。

MySql短小精悍，像access一样的文件型数据库，但比access强百倍，是真正多用户多任务的数据库系统，从Linux上移植过来的，安全性非常好，不过大部分操作是在dos下进行，虽然也有第三方开发的图形界面但并不好用。MySQL是跨多平台的数据库管理软件，可运行于LINUX、NT、UNIX等系统，可支持命令和图形化管理，对于一般的数据库足以应付了，占用系统资源较少，速度较快，而且是开源的。

Oracle各方面都比较成熟,但对硬件要求高，用于数据完整性、安全性要求较高的场合，能在所有主流平台上运行，完全支持所有的工业标准，采用完全开放策略。可以使客户选择最适合的解决方案，对开发商全力支持。平行服务器通过使一组结点共享同一簇中的工作来扩展服务器的能力,提供高可用性和高伸缩性的簇的解决方案，获得最高认证级别的iso标准认证，多层次网络计算，支持多种工业标准，可以用odbc,jdbc,oci等网络客户连接，较复杂，同时提供gui和命令行，在windows和unix下操作相同，如果windows不能满足需要,用户可以把数据库移到unix中。其操作和设置比较复杂，适用于有一定操作经验的用户。

db2能在所有主流平台上运行（包括windows）。最适于海量数据。DB2在企业级的应用最为广泛，在全球的500家最大的企业中,几乎85%以上用DB2数据库服务器，而国内到97年约占5%。

总之，各个主流数据库各有优势与侧重，对于初学者而言，建议从MS SQL Server着手学习，众所周知，微软的东西么，简单易懂。

问题九：该选择哪个开源数据库？哪一个更好如果打算为项目选择一款免费、开源的数据库，那么你可能会在MySQL与PostgreSQL之间犹豫不定。MySQL与PostgreSQL都是免费、开源、强大、且功能丰富的数据库。你主要的问题可能是：哪一个才是最好的开源数据库，MySQL还是PostgreSQL呢？该选择哪一个开源数据库呢？

在选择数据库时，你所做的是个长期的决策，因为后面如果再改变决定将是非常困难且代价高昂的。你希望一开始就选择正确。两个流行的开源数据库MySQL与PostgreSQL常常成为最后要选择的产品。对这两个开源数据库的高层次概览将会有助于你选择最适合自己需要的。

MySQL

MySQL相对来说比较年轻，首度出现在1994年。它声称自己是最流行的开源数据库。MySQL就是LAMP（用于Web开发的软件包，包括Linux、Apache及Perl/PHP/Python）中的M。构建在LAMP栈之上的大多数应用都会使用MySQL，包括那些知名的应用，如WordPress、Drupal、Zend及phpBB等。

一开始，MySQL的设计目标是成为一个快速的Web服务器后端，使用快速的索引序列访问方法（ISAM），不支持ACID。经过早期快速的发展之后，MySQL开始支持更多的存储引擎，并通过InnoDB引擎实现了ACID。MySQL还支持其他存储引擎，提供了临时表的功能（使用MEMORY存储引擎），通过MyISAM引擎实现了高速读的数据库，此外还有其他的核心存储引擎与第三方引擎。

MySQL的文档非常丰富，有很多质量不错的免费参考手册、图书与在线文档，还有来自于Oracle和第三方厂商的培训与支持。

MySQL近几年经历了所有权的变更和一些颇具戏剧性的事件。它最初是由MySQL AB开发的，然后在2008年以10亿美金的价格卖给了Sun公司，Sun公司又在2010年被Oracle收购。Oracle支持MySQL的多个版本：Standard、Enterprise、Classic、Cluster、Embedded与munity。其中有一些是免费下载的，另外一些则是收费的。其核心代码基于GPL许可，对于那些不想使用GPL许可的开发者与厂商来说还有商业许可可供使用。

现在，基于最初的MySQL代码还有更多的数据库可供选择，因为几个核心的MySQL开发者已经发布了MySQL分支。最初的MySQL创建者之一Michael Monty Widenius貌似后悔将MySQL卖给了Sun公司，于是又开发了他自己的MySQL分支MariaDB，它是免费的，基于GPL许可。知名的MySQL开发者Brian Aker所创建的分支Drizzle对其进行了大量的改写，特别针对多CPU、云、网络应用与高并发进行了优化。

PostgreSQL

PostgreSQL标榜自己是世界上最先进的开源数据库。PostgreSQL的一些粉丝说它能与Oracle相媲美，而且没有那么昂贵的价格和傲慢的客服。它拥有很长的历史，最初是1985年在加利福尼亚大学伯克利分校开发的，作为Ingres数据库的后继。

......>>

问题十：EXCEL作图要带数据源是什么意思就是你用excel画的图形，这个图是根据什埂数据生成的，这个数据必须附上。

你右键点击excel图的绘图区域，图表选项-数据表选项卡，勾选“显示数据表”前面的方框，就可以在你的绘图区域下显示源数据了。

或者你右键点击excel图的绘图区域，源数据-数据区域选项卡，看数据区域框中的数据地址，找到相应的地址，将里面的内容拷贝出来即可。

三、数据库含义

问题一：数据库是什么意思？数据库

data base

为满足某一部门中多个用户多种应用的需要，按照一定的数据模型在计算机系统中组织、存储和使用的互相联系的数据***。

带有数据库的计算机系统，除具备一般的硬件、软件外，必须有用以存储大量数据的直接存取存储设备、管理并控制数据库的软件――数据库管理系统(DBMS)、管理数据库的人员――数据库管理员(DBA)。这样的数据、硬件、软件和管理人员的总体构成数据库系统。数据库仅是数据库系统的一个组成部分。

数据库系统的功能和特征数据库系统由文卷系统发展而来。与文卷系统相比，这种系统具有数据、体系和控制三个方面的主要特征。

数据特征在文卷系统中虽然程序与数据之间可用存取方法进行转换,但文卷还是与应用程序对应的,即数据仍面向应用。每一应用各自建立自己的一组文卷。不同的应用若涉及相同的数据，则这些数据分别纳入各自的文卷之中。文卷的各种记录之间没有建立联系，因而数据冗余度大。增加新的应用，必须同时增加新的文卷。因此，文卷系统中的文卷是无结构的、不易扩充的信息***。数据库则不仅描述数据本身，而且描述数据之间的联系。它的数据结构反映了某一部门的整体信息结构，数据冗余度小、易于扩充新的应用，因而是面向数据总体结构的信息***，可为多个用户共享。

体系特征一切数据都有逻辑和物理两个侧面。在数据库系统中，数据逻辑结构的描述称为逻辑模式。逻辑模式又分为描述全局逻辑结构的全局模式(简称模式)和描述某些应用所涉及的局部逻辑结构的子模式。数据物理结构的描述称为存储模式。这两种模式总称为数据库模式。

数据库系统中，用户根据子模式编制程序。子模式与模式模式与存储模式之间有软件进行映射。因此,程序与数据之间具有两级独立性：物理独立性和逻辑独立性。数据的存储模式改变，而模式可以不改变，因而不必改写应用程序,这称为物理独立性。模式改变时,子模式可能不改变，也就不必改写应用程序，这称为逻辑独立性。由于数据库系统具备比较高的程序与数据的独立性，可以使程序员在编制应用程序时集中精力考虑算法逻辑，不必过问物理细节，而且可以大大减少应用程序维护的工作量。

控制特征数据库数据数量庞大，结构复杂，又为多个用户所共享。因此，必须由数据库管理系统在定义、建立、运行以及维护时进行统一管理和控制，以保证数据库数据的安全性、完整性和并发操作的一致性。此外，还必须有数据库管理员专门负责对数据库的管理、控制监督和改进。

由于数据库系统具有上述特征，它的出现使信息系统的研制从围绕加工数据的程序为中心，转变到围绕共享的数据库来进行。这便于数据的集中管理，有利于应用程序的研制和维护。数据减少了冗余度和提高了相容性，从而提高了作出决策的相容性。因此，大型复杂的信息系统大多以数据库为核心，数据库系统在计算机应用中起着越来越重要的作用。

研究课题数据库研究的课题，主要涉及三个领域。

数据库管理系统软件的研制 DBMS是数据库系统的基础。研制DBMS的基本目标，是扩大功能，提高性能和可用性，从而提高用户的生产率。70年代以来，研制的重点是探索关系数据库管理系统的设计，内容包括关系数据语言、查询优化、并发控制和系统性能等。另一类课题是对DBMS标准化的研究，即研究一个统一的DBMS体系结构的规范。

数据库设计这是在计算机系统具有的数据库管理系统的基础上，按照应用要求以及计算机系统所提供的数据模型和功能，设计一个结构良好、使用方便、效率较高的，以数据库为核心的应用信息系统。这一领域主要的研究课题，是数据库设计方法学和设计工具的探索。例如，运用软件工程的方法和工具指导数据库设计；......>>

问题二：数据库的定义数据库，简单来说是本身可视为电子化的文件柜――存储电子文件的处所，用户可以对文件中的数据进行新增、截取、更新、删除等操作。数据库指的是以一定方式储存在一起、能为多个用户共享、具有尽可能小的冗余度的特点、是与应用程序彼此独立的数据***。在经济管理的日常工作中，常常需要把某些相关的数据放进这样的“仓库”，并根据管理的需要进行相应的处理。例如，企业或事业单位的人事部门常常要把本单位职工的基本情况(职工号、姓名、年龄、性别、籍贯、工资、简历等)存放在表中，这张表就可以看成是一个数据库。有了这个数据仓库我们就可以根据需要随时查询某职工的基本情况，也可以查询工资在某个范围内的职工人数等等。这些工作如果都能在计算机上自动进行，那我们的人事管理就可以达到极高的水平。此外，在财务管理、仓库管理、生产管理中也需要建立众多的这种数据库，使其可以利用计算机实现财务、仓库、生产的自动化管理。数据库是依照某种数据模型组织起来并存放二级存储器中的数据***。这种数据***具有如下特点：尽可能不重复，以最优方式为某个特定组织的多种应用服务，其数据结构独立于使用它的应用程序，对数据的增、删、改、查由统一软件进行管理和控制。从发展的历史看，数据库是数据管理的高级阶段，它是由文件管理系统发展起来的。

问题三：数据库中<>''是什么意思是不等号，也有的语言可写作：#或!=

问题四：数据库中@是什么意思 ]@]@]

代表局部变量

问题五：数据库中@代表什么意思 ]@]@]

是:局部变量声明，如果没有@的字段代表是列名；

eg：

声明变量： declare@name varchar(8)

赋值： set@name='张三'

查询： select* from stuInfo where stuName=@name

由set和 select进行赋值；

select一般用于查询数据，然后再赋值变量。

还有

error等是全局变量，系统自定义的，我们只读，不能改！！

问题六：数据库中的码是什么含义?码是数据系统中的基本概念。所谓码就是能唯一标识实体的属性，他是整个实体集的性质，而不是单个实体的性质。它包括超码，候选码，主码。超码是一个或多个属性的***，这些属性可以让我们在一个实体集中唯一地标识一个实体。如果K是一个超码，那么K的任意超集也是超码，也就是说如果K是超码，那么所有包含K的***也是超码。候选码是从超码中选出的，自然地候选码也是一个或多个属性的***。因为超码的范围太广，很多是我们并不感兴趣即无用处的。所以候选码是最小超码，它们的任意真子集都不能成为超码。例如，如果K是超码，那么所有包含K的***都不能是候选码；如果K，J都不是超码，那么K和J组成的***（K，J）有可能是候选码耽是从多个候选码中任意选出一个做为主码，如果候选码只有一个，那么候选码就是主码。虽然说主码的选择是比较随意的，但在实际开发中还是要靠一定的经验，不然开发出来的系统会出现很多问题。一般来说主码都应该选择那此从不或者极少变化的的属性。 blog.csdn/...6.aspx

问题七：数据库,数据库是什么意思数据是当今信息社会的一种极为重要的资源，人们的一切活动都离不开数据。如学校中的学生档案、学习成绩记录、学校会计帐务，工厂的自动化系统需要生产线上的实时数据，军事指挥员需要的各种情报，各个部门中的工作人员无时无刻不在和数据打交道。在信息时代，由于数据量的急剧增长，需要利用计算机快速，准确地处理和加工大量的数据，于是产生了数据库和数据库管理系统。简单地说，数据库（Data Base，简记为DB）是为某种特殊目的而组织起来的记录和文件的***。数据库管理系统（Data Base Management System，简记为DBMS）则是在计算机中对数据库进行定义、描述、建立、管理、和维护的系统软件。

一个数据库系统一般包括四个重要组成部分：数据库、用户、软件和硬件。

数据，是指数据库系统中集中存储的椅披数据***，即数据库，它是数据库系统的工作对象，通常数据库中、存储的数据具有集成性和共享性。

集成性，是指把某特定应用环境中的各种应用相关的数据及数据之间的联系全部集中地按照一定的结构进行存储。

共享性，是指数据库中的一块块数据可为多个不同的用户所共享，即多个不同用户，使用多种不同的语言，为了不同的应用目的，而同时存取数据库，甚至同时存取同一块数据。

用户，存在一组使用数据库的用户，即指存储、维护和检索数据的各类请求。数据库系统中有三类用户：终端用户、应用程序员和数据库管理员。

终端用户是指从计算机终端存取数据库的人员，也可称为联机用户。

应用程序员是指负责编写应用程序的人员。

数据库管理员是指全面负责数据库存取、维护和正常使用的人员。

软件，是指负责数据库存取、维护和管理的软件系统，通常称为数据库管理系统（DBMS）。数据库系统中各类用户对数据库的各种操作请求，均由DBMS完成，它是苏剧苦笑台的核心软件。DBMS是在操作系统的支持下工作的。

问题八：*在数据库中代表什么意思啊*代表所有

例如：select* from MyTable

就是将表MyTable中的所有列的数据选出来

问题九：数据库语句中(+)是什么意思在oracle中(+)用来表示左连接.

and a.serv_id= b.serv_id(+)相当于

a left join b on a.serv_id= b.serv_id

反过来

and a.serv_id(+)= b.serv_id那就是右连接,相当于

a right join b on a.serv_id= b.serv_id

这两句，在oracle里是等价的，我查看过俯行计划，两者消耗时间是一样的