std::scanf, std::fscanf, std::sscanf

< cpp‎ | io‎ | c
 
 
 
 
定义于头文件 <cstdio>
int scanf( const char* format, ... );
(1)
int fscanf( std::FILE* stream, const char* format, ... );
(2)
int sscanf( const char* buffer, const char* format, ... );
(3)

从各种源读取数据,按照 format 转译并存储结果于给定位置。

1)stdin 读数据
2) 从文件流 stream 读数据
3) 从空终止字符串 buffer 读数据

参数

stream - 读取来源的文件流
buffer - 指向读取数据来源的空终止字符串
format - 指向指定如何读取输入的空终止字符串的指针。

格式字符串由下列内容组成

  • 非空白多字节字符,除了 % :每个格式字符串中的这种字符处理来自输入流的准确同一字符,或若它与流的下个字符比较不相等则导致函数失败。
  • 空白符:任何格式字符串中的单个空白符处理所有来自输入的可用连续空白符(如同通过于循环中调用 isspace 确定)。注意格式字符串中 "\n"" ""\t\t" 或其他空白无区别。
  • 转换说明:每个转换说明拥有下列格式:
  • 引入用 % 字符
  • (可选)赋值抑制字符 * 。若存在此选项,则此函数不将结果赋值给任何接收用参数。
  • (可选)指定最大域宽的整数数字(大于零),即函数进行在当前转换说明所指定的转换时,允许处理的最大字符数。注意若不提供宽度,则 %s 和 %[ 可能导致缓冲区溢出。
  • (可选)指定接收参数大小的长度修饰符,即实际目标类型。这影响转换准确性和溢出规则。默认目标类型对每个转换类型不同(见下表)。
  • 转换格式说明符

下列格式说明符可用:

转换
说明符
解释 参数类型
长度修饰符 →
hh

(C++11)

h (无) l ll

(C++11)

j

(C++11)

z

(C++11)

t

(C++11)

L
% 匹配字面 % N/A N/A N/A N/A N/A N/A N/A N/A N/A
c
匹配一个字符字符的序列

若使用了宽度说明符,则匹配准确的宽度个字符(该参数必须是指向有充足空间的数组的指针)。不同于 %s 和 %[ ,它不会在数组后附加空字符。

N/A N/A
char*
wchar_t*
N/A N/A N/A N/A N/A
s
匹配非空白字符的序列(一个字符串

若使用宽度说明符,则至多匹配宽度个字符,或匹配到首个提前出现的空白符前。总是在匹配的字符后存储一个空字符(故参数数组必须有至少宽度 +1 个字符的空间)。

[集合]
匹配一个来自 集合 的字符的非空字符序列。

若集合的首字符是 ^ ,则匹配所有不在集合中的字符。若集合以 ]^] 开始,则 ] 字符亦被包含入集合。在扫描集合的非最初位置的字符 - 是否可以指示范围,如 [0-9] ,是实现定义的。若使用宽度说明符,则最多匹配到宽度。总是在匹配的字符后存储一个空字符(故参数数组必须有至少宽度 +1 个字符的空间)。

d
匹配一个十进制整数

该数的格式同 strtol() 以值 10base 时所期望者

signed char*unsigned char*
signed short*unsigned short*
signed int*unsigned int*
signed long*unsigned long*
signed long long*unsigned long long*
intmax_t*uintmax_t*
size_t*
ptrdiff_t*
N/A
i
匹配一个整数

该数的格式同 strtol() 以值 0base 时所期望者(基底以首个分析的字符确定)

u
匹配一个无符号十进制整数

该数的格式同 strtoul() 以值 10base 参数时所期望者。

o
匹配一个无符号八进制数

该数的格式同 strtoul() 以值 8base 参数时所期望者。

x, X
匹配一个无符号十六进制整数

该数的格式同 strtoul() 以值 16base 参数时所期望者。

n
返回迄今读取的字符数

不消耗输出。不增加赋值计数。若此说明符拥有赋值抑制运算符,则行为未定义。

a, A(C++11)
e, E
f, F
g, G
匹配一个浮点数

该数的格式同 strtof() 所期望者。

N/A N/A
float*
double*
N/A N/A N/A N/A
long double*
p
匹配定义一个指针的实现定义的字符序列。

printf 系列函数应该用 %p 格式说明符产生同样的序列。

N/A N/A
void**
N/A N/A N/A N/A N/A N/A

对于每个异于 n 的转换说明符,不超过任何指定域宽,且要么是转换说明符所准确期待,要么是其所期待的前缀的最长输入字符序列,即是从流中消耗的内容。此消耗序列后的首个字符若存在,则保持未读取。若被消耗序列长度为零,或被消耗序列不能转换成上面所指定的项目,则发生匹配失败,除非遇到文件尾、编码错误,或阻止从流输入的读取错误,此情况下此为输入失败。

所有异于 [cn 的转换说明符,在尝试分析输入前消耗并舍弃所有前导空白字符(如同以调用 isspace 来确定)。这些被消耗的字符不计入指定的最大域宽。

转换说明符 lclsl[ 进行多字节到宽字符转换,如同如同在转换首字符前,通过用初始化到零的 mbstate_t 对象调用 mbrtowc()

转换说明符 s[ 始终在匹配字符之后存储一个空字符。目标数组的大小必须至少比指定域宽大一。

定宽整数类型int8_t 等)的正确的转换说明定义于头文件 <cinttypes> (虽然 SCNdMAXSCNuMAX 等就是 %jd%ju 等的别名)。

在每个转换说明符后有一个序列点;这允许存储多个域到同一“池”变量中。

在分析以无数字指数为结尾的不完整浮点值,如以转换说明符 %f 分析 "100er" 时,消耗序列 "100e" (可能为合法浮点数的最长前缀),并导致匹配错误(被消耗序列不能转换成浮点数),而留下 "r" 。某些既存实现不遵守此规则并回滚,通过消耗 "100" 而留下 "er" ,例如 glibc 漏洞 1765


... - 接收的参数

返回值

成功赋值的参数数(在首个参数赋值前发生匹配失败的情况下可为零),或若在赋值首个接收的参数前输入失败则为 EOF

注解

因为大多数转换指定符首先消耗所有连续空白符,如下代码

std::scanf("%d", &a);
std::scanf("%d", &b);

会读取输入于不同行(第二个 %d 会消耗第一个剩下的换行符)或同一行中为空格或制表符所分隔的(第二个 %d 会消耗空格或制表符)二个整数。

不消耗前导空白符的转换指定符,如 %c ,可通过在格式化字符串中用空白符使得它这么做:
std::scanf("%d", &a);
std::scanf(" %c", &c); // 忽略 %d 后的换行符,然后读一个 char

示例

#include <iostream>
#include <clocale>
#include <cstdio>
 
int main()
{
    int i, j;
    float x, y;
    char str1[10], str2[4];
    wchar_t warr[2];
    std::setlocale(LC_ALL, "en_US.utf8");
 
    char input[] = u8"25 54.32E-1 Thompson 56789 0123 56ß水";
    // 按如下分析:
    // %d :整数 
    // %f :浮点值
    // %9s :至多 9 个非空白字符的字符串
    // %2d :二位整数(数字 5 与 6 )
    // %f :浮点值(数字 7 、 8 、 9 )
    // %*d 不存储于任何位置的整数
    // ' ' :所有连续空白符
    // %3[0-9] :至多 3 位数字的字符串(数字 5 与 6 )
    // %2lc :二个宽字符,用多字节到宽转换
    int ret = std::sscanf(input, "%d%f%9s%2d%f%*d %3[0-9]%2lc",
                     &i, &x, str1, &j, &y, str2, warr);
 
    std::cout << "Converted " << ret << " fields:\n"
              << "i = " << i << "\nx = " << x << '\n'
              << "str1 = " << str1 << "\nj = " << j << '\n'
              << "y = " << y << "\nstr2 = " << str2 << '\n'
              << std::hex << "warr[0] = U+" << warr[0]
              << " warr[1] = U+" << warr[1] << '\n';
}

输出:

Converted 7 fields:
i = 25
x = 5.432
str1 = Thompson
j = 56
y = 789
str2 = 56
warr[0] = U+df warr[1] = U+6c34

参阅

(C++11)(C++11)(C++11)
使用可变实参列表
stdin、文件流或缓冲区读取有格式输入
(函数)
从文件流获取字符串
(函数)
打印有格式输出到 stdout、文件流或缓冲区
(函数)
转换字符序列到整数或浮点值
(函数)