Stata
是一个完整的、集成的软件包,它提供了所有数据科学所需的数据操作、可视化、统计和可重复报告功能。
数据管理
Stata
的数据管理功能为您提供完全的控制权。
√
框架
--
同时管理多个数据集
√
导入、导出
√
JDBC
,
ODBC, SQL
√
排序、匹配、合并、连接、追加、创建
√
内置电子表格
√ Unicode
√
处理文本或二进制数据
√
在本地或
web
上访问数据
√
跨组收集统计信息
√ BLOBs-
可以保存整个文档的字符串
√
数十亿行数据
√
成千上万的变量
√
生存数据、面板数据、多级数据、调查数据、离散选择数据、多重插补数据、分类数据、时间序列数据
更重要的是,支持您所有的数据科研需求。
出版物质量图形
您可以通过单击来创建自定义图,也可以编写脚本以可复制的方式生成数百或数千个图。将图形导出到
EPS
或
TIFF
以供发布,将图形导出到
PNG
或
SVG
以供
web
使用,或将图形导出到
PDF
以供查看。使用集成
Graph Editor
,您可以单击以更改图形的任何内容,或者添加标题、注释、
线条
、箭头和文本。
Stata
让生成具有出版质量、风格独特的图形变得更加容易。
创建动态文档
自动报告结果所需的所有工具。
动态
Markdown
文档
创建
Word
文档
创建
PDF
文档
创建
Excel
格式的文件
图形方案
Word, HTML, PDF, SVG, PNG
真正的可再生的研究
很多人谈论可复制研究。
Stata
致力于此已有
30
多年。
我们在不断添加新功能。我们甚至从根本上改变了语言元素。无论如何,
Stata
是唯一具有集成版本控制的统计包。如果您在
1985
年编写了一个脚本来执行分析,那么相同的脚本在今天仍然会运行并产生相同的结果。您在
1985
年创建的任何数据集,现在都可以读取。
2050
年也是如此。
Stata
将能够运行您今天所做的任何事情。我们重视产品的可重复性。
PyStata-Python
集成
以交互方式调用
Python
或将
Python
嵌入到
Stata
代码中。从
Python
中调用
Stata
,并在
IPython
环境中调用
Stata
代码。在
Jupyter
笔记本中使用
Stata
。在
Stata
和
Python
之间无缝地传递数据和结果。使用
Python
中的
Stata
分析。在
Stata
中使用任何
Python
包。
-
用于可视化的
Matplotlib
和
seaborn
-
用于网页抓取的
Beautiful Soup
和
Scrapy
-
用于数值分析的
NumPy
和
Panda
-
用于机器学习的
TensorFlow
和
scikit-learn
……
帮助文档
当您需要进行分析或理解您使用的方法时,
Stata
不会让您束手无策,也不会让您通过订购书籍来了解每一个细节。
我们的每个数据管理功能都得到了充分的解释和文档化,并在实际示例中有演示。每个估计量都有完整的文档记录,包括一些关于真实数据的例子,以及如何解释结果的真实讨论。示例提供了数据,这样您就可以在
Stata
中工作,甚至扩展分析。我们将为您提供每个功能的快速入门,展示一些最常见的用法。
我们的方法和公式部分提供了正在计算的内容的细节,我们的参考资料为您提供了更多信息。
Stata
是一个强大的软件包,所以在
35
卷中有超过
18,000
多页的文档。
但是不要担心,
输入
help
和帮助的主题内容
, Stata
将搜索它的关键字、索引,甚至社区贡献的包,从而为您提供您需要了解的关于这个主题的所有信息。
Stata
中的一切都是可用的。
值得信赖
我们不只是对统计方法编程,我们还要验证它们。
您从
Stata
估计值中看到的结果依赖于与其他估计值的比较、一致性和覆盖范围的蒙特卡罗模拟以及统计人员的广泛测试。我们发布的每个
Stata
版本都通过了一个认证套件,其中包含
410
万行测试代码,生成
580
万行输出。我们会对
580
万行输出中的每个数字和文本片段进行验证。
使用方便
Stata
的所有功能都可以通过菜单、对话框、控制面板、数据编辑器、变量管理器、图形编辑器,
表格生成器,
甚至
SEM
图表
生成
器来访问。您可以通过任何分析来指出和单击您的方法。
如果您不想编写命令和脚本,则不必编写。
即使是在单击时,也可以记录所有结果,并在以后的报告中包含它们。您甚至可以保存操作创建的命令,并在稍后重新生成完整的分析。
易于上手
Stata
执行任务的命令直观且易于学习。更便捷的是,关于执行任务的所有知识都可以应用于其他任务。例如,您只需将
if gender=='female'
添加到任何命令中,以将您的分析限制为样本中的女性。您只需将
vce(robust)
添加到任何估计中,即可获得对许多常见假设具有
robust
的标准错误和假设检验。
这种一致性可以更深入研究。关于数据管理命令的知识通常适用于评估命令,反之亦然。还有一组完整的后估计命令来执行假设检验、形成线性和非线性组合、进行预测、形成对比,甚至使用交互图执行边际分析。这些命令在几乎每个评估之后都以相同的方式工作。
排序命令读取和清理数据,然后执行统计检验和评估,最后报告结果,这是可重复研究的核心。
Stata
使得所有的研究人员都可以访问这个过程。
易于自动化
每个人都有他们一直在做的任务
--
创建特定类型的变量、生成特定的表、执行一系列统计步骤、计算
RMSE
等等。可能性是无限的。
Stata
有数千个内置过程,但是您可能有相对独特的任务,或者希望以特定的方式完成这些任务。
如果您编写了在给定数据集上执行任务的脚本,那么很容易将该脚本转换为可用于所有数据集、任何变量集和任何观察集的脚本。
易于扩展
您自动化的一些东西可能非常有用,您希望与同事共享它们,甚至让
Stata
的所有用户都可以使用它们。那也很简单。只需一小段代码,您就可以将自动化脚本转换为
Stata
命令。支持
Stata
官方命令支持的标准特性的命令。可以像使用正式命令一样使用的命令
高级编程
Stata
还包括一种高级编程语言
Mata
。
Mata
具有您在编程语言中所期望的结构、指针和分类,并添加了对矩阵编程的直接支持。
虽然使用
Stata
不需要编写程序,
但是了解到一种快速和完整的编程语言是很有必要的。
Mata
既是一个用于操作矩阵的交互式环境,也是一个可以生成编译和优化代码的完整开发环境。它包括处理面板数据的特殊功能,对真实或复杂的矩阵执行操作,为面向对象编程提供完整的支持,并与
Stata
的各个方面完全集成。
Stata
还有
PyStata
,它提供了全面的
Python
集成,允许您直接从
Stata
代码中利用
Python
的所有功能,并从
Python
代码中使用
Stata
的所有功能。
Stata
甚至可以让您通过针对每种语言的本地
API
将
C
、
C++
和
Java
插件集成到
Stata
程序中。
您甚至可以将
Java
代码直接嵌入到您的
Stata
代码中!
社区促进功能更新
Stata
是可编程的,因此开发人员和用户每天都要添加新功能,以满足当今研究人员日益增长的需求。有了
Stata
的互联网功能,新功能和官方更新可以在互联网上安装。
世界一流的技术支持
Stata
技术支持对注册用户是免费的,这意味着您得到的要比付出的多得多。我们有专业的
Stata
程序员和统计人员来解答您的技术问题。从棘手的数据管理解决方案到让您的图形看起来恰到好处,从解释一个强大的标准错误到指定多级模型,我们都可以给您答案。
跨平台兼容
Stata
可以在
Windows
、
Mac
和
Linux/Unix
计算机上运行。然而,我们的许可证不是特定于平台的。
这意味着如果您有一台
Mac
笔记本电脑和一台
Windows
桌面电脑,您不需要两个单独的许可证来运行
Stata
。您可以在任何受支持的平台上安装
Stata
许可证。
Stata
数据集、程序和其他数据可以跨平台共享,无需转换。您还可以快速轻松地从其他统计软件包、电子表格和数据库导入数据集。
广泛被使用
Stata
被研究人员使用了
30
多年,它提供了数据科学数据操作、可视化、统计和可重复报告所需的一切。
Stata
可以应用的领域包括
行为科学
生物统计
数据科学
经济学
教育学
流行病学
金融、商业和营销
机构研究
医学
政治学
公共卫生
公共政策
社会学
Stata
各版本参数对比
功能
|
Stata/BE
|
Stata/SE
|
Stata/MP
|
|
|
|
2-core
|
4-core
|
6-core
|
最大变量数
2,048
32,676
120,000
|
√
-
-
|
√
√
-
|
√
√
√
|
√
√
√
|
√
√
√
|
最大观测值
2.14 billion
20 billion
计算速度
1
倍速
2
倍速
4
倍速
更快
|
√
√
-
-
-
|
√
√
-
-
-
|
√
√
√
√
-
-
|
√
√
√
√
√
-
|
√
√
√
√
√
√
|
使用
1000
万个观测值和
20
个协变量进行逻辑回归的时间
20
秒
10
秒
5.2
秒
<5.2
秒
|
√
-
-
-
|
√
-
-
-
|
√
√
-
-
|
√
√
√
-
|
√
√
√
√
|
最大自变量数
798
10,998
65,532
|
√
-
-
|
√
√
-
|
√
√
√
|
√
√
√
|
√
√
√
|
系统需求
Stata for Windows
Windows 11*
Windows 10 *
Windows Server 2022, 2019, 2016, 2012R2 *
* Stata requires 64-bit Windows for x86-64 processors made by Intel or AMD (Core i3 equivalent or better)
Stata for Mac
Mac with Apple Silicon or Intel processors
macOS 11.0 (Big Sur) or newer for Macs with Apple Silicon and macOS 10.13 (High Sierra) or newer for Macs with Intel processors
Stata for Linux
Any 64-bit (Core i3 equivalent or better) running Linux
Minimum requirements include the GNU C library (glibc) 2.17 or better and libcurl4
Check the output of ldd -v within a terminal
For xstata, you need to have GTK 2.24 installed
硬件需求
版本
|
内存空间
|
磁盘空间
|
Stata/BE
|
1 GB
|
2 GB
|
Stata/SE
|
2 GB
|
2 GB
|
Stata/MP
|
4 GB
|
2 GB
|