连接到 MongoDB (v.1)
使用此版本 MongoDB 连接器的脚本将无法在 Analytics 18.x 中运行,必须更新才能使用新版本的连接器。
只要连接器和数据源保持兼容,此版本的连接器将能够继续在 Analytics 17.x 和早期版本的 Analytics 中使用。
请参阅转换到新的 ACL 连接器版本
概念信息
MongoDB 是一种云数据服务。您可以使用 MongoDB 数据连接器导入您的组织的 MongoDB 数据。
开始之前
要连接到 MongoDB,您必须收集以下信息:
-
托管 MongoDB 数据库的服务器的服务器名称或者 IP 地址
- 正确的连接端口
- MongoDB 数据库的名称
有关收集连接必备信息的帮助,请联系MongoDB您组织中的管理员。如果您的管理员不能帮助您,您或者您的管理员应该联系MongoDB支持人员。
创建 MongoDB 连接
- 从 Analytics 主菜单中选择导入 > 数据库和应用程序。
- 从新建连接选项卡中,在 ACL 连接器部分中,选择MongoDB。
提示
您可以通过在过滤连接框中输入搜索字符串来过滤可用连接器的列表。连接器按字母顺序排列。
- 在数据连接设置面板中,输入连接设置,然后在面板底部单击保存并连接。
您可以接受默认的连接名称,也可以输入一个新的名称。
的连接被保存到现有连接选项卡。将来,您可以从已保存的连接重新连接到MongoDB。
一旦连接被建立,“数据访问”窗口将打开到暂存区域,并且您可以开始导入数据。要获得与从 MongoDB 导入数据有关的帮助,请参阅 使用 数据访问窗口。
连接设置
基本设置
| 设置 | 描述 | 示例 |
|---|---|---|
| 服务器 | 托管 MongoDB 数据库的服务器的主机名称或者 IP 地址。 | |
| 端口 |
MongoDB 服务器用来侦听客户端连接的 TCP 端口的编号。 默认值是 27017。 |
27017 |
| 数据库 | MongoDB 数据库的名称。 | |
| 连接到副本集 |
指定驱动程序是否可以访问您的 MongoDB 实施中的副本集:
|
已禁用 |
| 副本集名称 | 要访问的驱动程序的副本集的名称。 | |
| 辅助服务器 |
要在连接到副本集时使用的服务器的逗号分隔列表。 要指示服务器用于侦听客户端连接的 TCP 端口,请将一个冒号 (:) 和端口号附加到服务器名称或者 IP 地址。 |
|
| 认证机制 |
MongoDB 将用来认证该连接的认证机制:
|
无认证 |
| 服务名称 | MongoDB 服务器的 Kerberos 服务主体名称。 | mongodb |
| 认证源 |
用于认证的 MongoDB 数据库的名称。 仅当认证数据库不同于检索数据的数据库时,才需要此值。 |
管理员 |
| 用户名 | 用来向 MongoDB 进行认证的用户名。 | |
| 密码 | 用来向 MongoDB 进行认证的密码。 |
高级设置
| 设置 | 描述 | 示例 |
|---|---|---|
| 启用 SSL | 指定驱动程序是否使用 SSL 连接到服务器。 | 已禁用 |
| 允许自签名的证书 | 指定驱动程序是否允许来自服务器的自签署 SSL 证书。 | 已禁用 |
| PEM 密钥文件 | 包含用于验证客户端的证书的 .pem 文件的完整路径。 | |
| PEM 密钥密码 | 在“PEM 密钥文件”域中指定的客户端证书文件的密码。 | |
| 证书颁发机构文件 | 您用来验证服务器的 .pem 文件的完整路径。 | |
| 证书颁发机构目录 | 包含用来验证服务器的 .pem 文件的目录的完整路径。此设置使驱动程序能够访问多个 .pem 文件以进行 SSL 验证。 | |
| 证书吊销列表文件 | 包含撤销证书列表的 .pem 文件的完整路径。 | |
| 启用双重缓冲 |
指定驱动程序是否使用双缓冲技术检索数据。 MongoDB 驱动程序能够在 SELECT 操作期间使用双缓冲技术提高驱动程序的性能。 |
已启用 |
| 将字符串公开为 SQL_WVARCHAR |
指定字符串数据类型被映射到 SQL_WVARCHAR 还是 SQL_VARCHAR。 |
已启用 |
| 将二进制值公开为 SQL_LONGVARBINARY | 指定驱动程序是将二进制列作为 SQL_LONGVARBINARY 类型还是 SQL_VARBINARY 类型的数据返回。 | 已启用 |
| 启用传承 | 指定驱动程序是否优化虚拟表之间的联接,并且将过滤和聚合优化传递给 MongoDB 数据库以进行处理。 | 已启用 |
| 每个块获取的单证数 |
查询一次返回的最大文档数。此设置还确定启用双缓冲技术时使用的缓冲区大小。 默认值是 4096。 |
4096 |
| 字符串列大小 |
STRING 列中可以包含的最大字符数。 默认值是 255。 |
255 |
| 二进制列大小 |
二进制列的最大数据长度。 默认值是 32767。 |
32767 |
| 元数据机制 |
指定驱动程序在何处寻找架构定义:
|
数据库 |
| 本地文件 | 包含您希望驱动程序在连接到 MongoDB 时使用的架构定义的本地 JSON 文件的完整路径。 | |
| 抽样方法 |
指定驱动程序在生成临时架构定义时如何进行数据抽样:
|
转发 |
| 要抽样的单证数(0 表示对所有单证进行抽样) |
驱动程序可以抽样以生成临时架构定义的最大记录数。 当此选项被设置为 0 时,驱动程序对数据库中的每个文档进行抽样。 默认值是 100。 |
100 |
| 抽样步大小 |
驱动程序在扫描数据库以生成临时架构定义时进行记录抽样的时间间隔。例如,如果您将此选项设置为 2,则驱动程序每两秒钟在数据库中抽样一次。 默认值是 1。 |
1 |
| 回写批次大小(1-1000) |
驱动程序在写入操作期间一次可以处理的最大文档数。 默认值是 500。 |
500 |
| 写关注 |
必须确认写入操以便驱动程序报告成功写入操作的主服务器和辅助服务器的总数。 当此选项被设置为 0 时,驱动程序不要求写入操作被确认。 默认值是 1。 |
1 |
| 写关注超时 |
驱动程序在报告操作失败之前等待辅助服务器确认写入操作的最大秒数。 当此选项被设置为 0 时,驱动程序不会超时。相反,驱动程序会等待所有辅助服务器确认写入操作,然后报告该操作已成功。 默认值是 0。 |
5 |
| 写关注日志记录写 | 指定驱动程序是否要求在可以确认写入操作之前将来自写入操作的数据提交至日志。 | 已禁用 |
数据连接器更新
当您升级 Analytics 或机器人代理时,应该使用一个 机器人代理 数据连接器(ACCESSDATA 命令)测试用于导入数据的脚本。
由第三方数据源或 ODBC 驱动程序供应商进行的更改可能要求更新一个或多个数据连接器。脚本化数据连接可能需要更新以便继续正确工作。
- 重新运行导入更新连接的最轻松方式是使用 数据访问窗口 升级版本中的数据访问窗口手动执行导入。从日志复制 ACCESSDATA 命令并使用它更新您的脚本。
备注
在连接到数据源并重新运行导入之前,请清除连接器缓存以冲刷现有的表名称集。
在 数据访问窗口 的现有连接选项卡中,在连接器名称旁边选择
> 清除缓存。 - 更新域规范您还可能需要更新脚本主体中的域规范以匹配数据源或 ODBC 驱动程序中的表架构更改。可能的更改包括域名称、域数据类型、域和记录长度。
- 检查任何过滤的结果您还应该检查您在数据导入过程中应用的任何过滤的结果。您还应该检查您在数据导入过程中应用的任何过滤的结果。
MongoDB 数据连接器更改
下面列出了对 MongoDB 数据连接器进行的具体更改。
| Analytics 版本 | 更改 |
|---|---|
|
14.2 |
该连接器不再支持连接到 MongoDB 3.0 和 3.2。 可以向 MongoDB 3.4、3.6 和 4.0 建立连接。 |