通过 ODBC 访问关系型数据库
Source: Dev.to
Introduction
几乎每种文件格式都需要不同的函数(通常还需要不同的包),这让人容易感到不知所措——尤其是在处理多个参数和依赖时。不过,一旦你弄清楚哪些工具适用于哪些数据类型,向 R 导入数据就会变得简单且高效。
本指南旨在成为你的“一站式”参考。下次当你搜索 “如何将 XYZ 文件加载到 R?” 时,你就知道该去哪里找答案了。
What This Tutorial Covers
我们将演示在 R 中导入最常用的数据格式,包括:
- TXT 和 CSV 文件
- JSON 和 XML 数据
- HTML 表格
- Excel 工作簿
- SAS、SPSS、Stata 数据集
- MATLAB 和 Octave 文件
- 通过 ODBC 访问关系型数据库
我们还会分享一个实用的导入技巧,帮助你快速进行临时分析。
Preparing Your R Workspace Before Importing Data
Setting the Working Directory
大多数项目会把相关文件放在同一个文件夹中。将该文件夹设为工作目录可以简化文件导入。
# Show current working directory
getwd()
要更改工作目录:
setwd("path/to/your/folder")
设置好后,R 会自动在该位置查找文件——省去一次次输入冗长路径的麻烦。
Cleaning the Workspace
上一次会话留下的对象可能导致细微且令人沮丧的错误。保持工作空间干净通常是最好的做法。
rm(list = ls())
Pro tip: 除非必要,避免在退出时保存工作空间。全新的会话可以减少调试头痛。
Loading TXT, CSV, and Other Delimited Files
Reading Text Files (.txt)
分隔文本文件使用制表符、逗号或分号等分隔符。
Example structure
Category V1 V2A 3 2B 5 6B 2 3A 4 8A 7 3
# Default (tab‑delimited)
df This is a lifesaver for exploratory work, though formatting issues may occur.
Using Packages for Advanced Imports
Before using package‑based import functions:
install.packages("packageName") library(packageName)
Importing JSON Files
install.packages("rjson")
library(rjson)
# From a local file or URL
json_data **Next steps?** If you’re moving toward predictive modeling, scaling analytics, or deploying AI‑driven solutions, explore our **AI Consulting Services** to accelerate outcomes.
About Perceptive Analytics
“To enable businesses to unlock value in data.”
二十余年来,我们已与超过 100 家客户合作——从《财富》500 强企业到中型公司——帮助他们解决复杂的数据分析难题。我们的服务包括提供端到端的 Tableau 咨询服务,以及作为值得信赖的 Power BI 咨询公司,将数据转化为战略洞察。
我们期待与您交流!
You. Do reach out to us.