PowerPoint

C プログラミング入門
基幹7 (水5)
09: ポインタ・文字列
Linux にログインし、以下の講義ページ
を開いておくこと
http://www-it.sci.waseda.ac.jp/
teachers/w483692/CPR1/
2016-06-08
1
関数できなかったこと
配列を引数として渡す, 戻り値として返す
文字列を扱う
呼び出し元の変数を直接書き換える
例: 2 つの変数の値を入れ替える関数
例: scanf() はそのようなことを行う関数の一つ
複数の値を返す
⇒ポインタにより実現
2
メモリとアドレス
メモリには 1 byte ごとにアドレス (番地;
address) という数値が振られている
地球でいえば緯度経度などの位置情報
変数は変数名を介してメモリの操作をするの
でアドレスを意識することはない
コンパイラが生成するマシン語はアドレスを使っ
てメモリ操作を行っている
int year
double pi
2014
5000
5001
-3.14159
5002
5003
char c
'C'
アドレスの例
3
実験:アドレスの確認
変数のアドレスはアドレス演算子 & で取得
printf() で表示するには %p を使う
a
b
b[0]
b[1]
c
{
int a, b[4];
printf("a
printf("b
printf("b[0]
printf("b[1]
printf("c
double
%p\n",
%p\n",
%p\n",
%p\n",
%p\n",
普段は変数名を使い、自
動的にメモリにアクセス
するので、具体的なアド
レス値を見ることはほと
んどない。
c;
&a);
&b);
&b[0]);
&b[1]);
&c);
double c
?
0x7fff3bee15d8
0x7fff3bee15fc
0x7fff3bee15e0
0x7fff3bee15e0
0x7fff3bee15e4
0x7fff3bee15d8
int b[4]
?
int a
?
?
?
?
0x7fff3bee15fc
4
この実験でわかること
配列変数 b のアドレスと、先頭要素 b[0] の
アドレスが同じ。
a
b
b[0]
b[1]
c
{
int a, b[4];
printf("a
printf("b
printf("b[0]
printf("b[1]
printf("c
double
%p\n",
%p\n",
%p\n",
%p\n",
%p\n",
c;
&a);
&b);
&b[0]);
&b[1]);
&c);
double c
0x7fff3bee15fc
0x7fff3bee15e0
0x7fff3bee15e0
0x7fff3bee15e4
0x7fff3bee15d8
int b[4]
?
?
&b
&b[0]
int a
?
?
?
?
5
アドレスを格納して、メモリのないようにアクセスするための変
数
ポインタ
6
ポインタ変数 (pointer)
アドレスを格納するための変数
メモリの位置を指し示すのでポインタという
「何の値を指しているか」を表すために型を持つ
変数宣言時に * を名前の前につける
ポインタ変数の表示方法
普通の変数の宣言
int a
ポインタ変数の宣言
{
int a;
int *p;
p = &a;
ポインタ変数 p に変数 a
のアドレスを代入
?
int* p
具体的なア
ドレス値は
必要な時以
外書かない
5000
5000
非常に古いプログラムでは、ポインタ変数のサイズ (アド
レスのサイズ) とint 型のサイズが同じであることを仮定
して書かれてたものがある。しかし、64bit アーキテク
チャではまず正しく動作しない。
7
ポインタの宣言
ポインタ変数の宣言は普通の変数の宣言と混
在可能
型と * の関係に注意
{
int a, *p;
int *q, b;
int* c;
int* d, e;
int *r, *s;
int* と続けて書くと、「int へのポイ
ンタ」を表すように見えるので、好ま
れることもある。
しかし、あくまでも変数名それぞれに
* を付けるのが C の文法なので注意
int* 型ではなく、 int 型の変数とな
る
8
ポインタの初期化と代入
ポインタ変数の定義時に初期化が可能
通常の式では、代入演算子 = が使用可能
初期化
{
int a
int* p
?
int a, *p = &a;
int b, *q;
q = &b;
初期化をしない
ポインタ変数は
どこを指してい
るか不明
代入演算子による書き換え。
ポインタ変数に * は付けない
int b
int* q
?
代入後
未初期化
☠
9
ポインタ変数を通したメモリアクセス
ポインタ変数にデリファレンス演算子 * を付
けることで、ポインタが指すメモリ領域にア
間接演算子、参照はがしなどの別名がある
クセスできる
int a
int* p
?
{
int a, *p = &a;
a = 100;
*p = 120;
// (1)
// (2)
printf("%d\n", a);
printf("%d\n", *p);
(1)の代入で 100 となり、
(2)の代入で 120 となる
デリファレンス演算子
10
配列のアドレス
配列変数名は、配列の先頭アドレスに変換さ
0 番要素のアドレス
れる
int a[3]
{
int a[3];
int *p = a;
int *q = &a[0];
// p == q が成り立つ
int* p
1
?
?
a[0]
a[1]
a[2]
int* q
配列変数名そのまま書いた場合
// 以下の操作はすべて同じ
配列の 0 番要素のアドレス
a[0] = -5; *a = -5;
p[0] = -5; *p = -5;
11
アドレスの演算
以下の2つの計算だけが許されている
アドレスに整数を加減
• 「型」のサイズだけアドレスが移動する
• バイト単位で変化するわけではない
アドレス同士の差
• 「型」のサイズの倍数
{
int a[3], *p = a;
*p = 1;
p++;
*p = 3;
*(p+1) = 5;
説明は省略
int* p
int a[3]
1
3
5
a[0]
a[1]
a[2]
5000
5004
12
添字演算子
配列で使う [] はアドレス演算の一種である
添字演算子 (subscript operator, indexer)
配列専用の記法ではない
{
これは、配列の宣言な
ので演算子ではない
一般にアドレス a と整数 n に対して
a[n] == *(a+n)
int a[3], *p = a;
が成り立つ
// 以下はすべて等価
*p
= 1;
*a
= 1;
*(p+0) = 1;
*(a+0) = 1;
p[0]
= 1;
a[0]
= 1;
実は仕様上 0[p] などと書い
ても同じ意味になる。しかし、
この記法が役立つことは多分
ない。
先頭アドレス
int a[3]
1
?
?
a[0]
a[1]
a[2]
配列のアクセスは常に *(a+0)
と解釈される
13
例題:変数の入れ替え
関数から直接変数を操作することはふつうで
きない
temp
a
b
int main(void)
{
int a = 1, b = 5;
int temp;
1
temp
a
1
// swap a and b
// 一時的に別の変数に入れて行う
temp = a; a = b; b = temp;
// swap(a, b);
a
この計算を関数化したい
a
?
5
b
1
temp
5
b
1
temp
5
5
1
5
b
1
14
例題:変数の入れ替え
関数から直接変数を操作することはふつうで
仮引数名は実引数と関係がないので、 a,
きない
b という名前を含め、なんでもよい。
int main(void)
{
int a = 1, b = 5;
int temp;
// v1 と v2 を入れ替える
void noswap(int v1, int v2)
{
// この関数には、値のコピーが
// 渡されるので、 main 関数の
// a, b を書き換えることは
// 絶対にできない…
}
// swap a and b
// 一時的に別の変数に入れて行う
noswap(a, b);
単に値をコピーして渡すだけ
a, b が書き変わることはない
a
1
b
5
コピー
v1
1
v2
5
15
例題:変数の入れ替え
関数から直接変数を操作することはふつうで
仮引数の型をポインタにして、
きない
アドレスのコピーを受け取る
// v1 と v2 を入れ替える
void swap(int *v1, int *v2)
{
int temp;
temp = *v1;
ポインタの指す値
*v1 = *v2;
を操作するので、
*v2 = temp;
* が必要
}
int main(void)
{
int a = 1, b = 5;
int temp;
// swap a and b
// 一時的に別の変数に入れて行う
// temp = a; a = b; b = temp;
swap(&a, &b);
それぞれのアドレスを渡す
a
1
*v1
b
5
*v2
16
配列を渡す
配列そのものを関数に渡す機能はない
配列の先頭のアドレスを渡すことで疑似的に
可能
配列のサイズは関数からはわからない
サイズなどは個別に情報として渡す ポインタ変数で、
アドレスのコピー
を受け取る
func(a, 3)
int a[3]
1
?
?
a[0]
a[1]
a[2]
配列の先頭アドレス
(& はいらない)
void func(int *arr, int n)
{
...
17
例題:配列の総和
配列の先頭アドレスとサイズを渡す
int main(void)
{
int a[] = { 1, 2, 3, 4, 5 };
printf("%d\n", sum(a, 5));
...
配列の先頭アドレス
& はなくても可
配列サイズを自動的に計算するには、
sizeof(a)/sizeof(int) という式を使う
int arr[] と書く
こともできる。た
だし、配列として
認識されるわけで
はないので、サイ
ズを調べることは
できない。
n 個の情報が本当
にあるかどうかを
関数側では知るこ
とができない。
個数を別途渡す。
// arr から n 個分の総和
int sum(int *arr, int n)
{
int s, i;
for(i = 0, s = 0; i < n; ++i)
{ s += arr[i]; }
return s;
}
18
const ポインタ
関数の引数にポインタがある場合、値のコ
ピーではなくそのメモリの場所を直接アクセ
スしようとしている
const キーワードによって読み込みしかしな
いことを表せる
int main(void)
// arr から n 個分の総和
int sum(const int *arr, int n)
{
int s = 0, i;
for(i = 0; i < n; ++i)
s += arr[i];
return s;
読むだけ
}
{
int a[] = { 1, 2, 3, 4, 5 };
int s;
s = sum(a, 5);
// もし const がないと、
// この時点で配列 a が書き換え
//られているかもしれない…
19
文字列 (1)
20
文字列 (string)
文字列は、文字型 char の列として扱われる
文字列リテラルが式中に書かれると
システムによって自動的にメモリに配置され
ナル文字と読まれるのが普通
末尾には null 文字 ('\0') が付き
null 文字で
終わる
その先頭のアドレスを表す
システムのメモリ領域 (書き換え禁止)
{
const char *str
= "Hello, world!\n";
システム領域を書き換える
ことはできないので、
const を付ける方がよい
文字列リテラルはシ
ステム領域のアドレ
スになる
'H' 'e' 'l'
'd' '!' '\n' '\0'
char* str
21
文字列の関数での扱い
文字列は以下のどちらかの引数で受け取る
char *
const char *
printf() のプロトタイプ
文字列を書き換える
文字列は読むだけである
const は * の前ならどの位置でも可
null 文字で
終わる
int printf(const char *format, ...);
システムのメモリ領域
{
const char *str
= "Hello, world!\n";
printf("Hello, world!\n");
printf(str);
printf("%s", str);
...
'H' 'e' 'l'
'd' '!' '\n' '\0'
char* str
文字列を表示
する指定
22
文字配列
配列の要素として文字列を書いたもの
専用の初期化記法を用いる
配列変数の宣言
初期値として文字列リテラルを指定
{
Greeting: Hello!
■
char greeting[] = "Hello!";
printf("Greeting: %s\n", greeting);
null 文字が自動的に
付加される
char greeting[7]
'H' 'e' 'l' 'l' 'o' '!' '\0'
greeting[6]
null 文字を入れて 7 要素の
配列として確保される
23
文字配列の初期化
文字配列の初期化では末尾に null 文字が自動
的に付加される
文字列リテラルの指すアドレスによるポイン
タ変数の初期化との違いに注意
システムのメモリ領域
{
char greeting[] = "Hello!";
// 以下の様に書くのと等価
// char greeting[]
//
= { 'H', 'e', 'l', 'l', 'o', '!', '\0' };
const char *greeting_ptr = "Hello!";
システム領域を書き換えることはできな
いので、 常に const を付ける方がよい
"Hello!"
char greeting[7]
"Hello!"
char *greeting_ptr
24
文字配列と文字列へのポインタの違い
文字配列変数は配列の一種なので、自由に書
き換えることができる
文字列へのポインタ変数は、指し示す場所が
配列変数の領域なのか、システム領域なのか
は区別しない
システムのメモリ領域
"Hello!"
char greeting[7]
"Hello!"
char *greeting_ptr
25
例題:文字列の長さを調べる (#1)
文字列の末尾は常に null 文字があるので、そ
れが出現するまでの文字数をカウントする
int length(const char *str)
{
int len = 0; // 文字列の長さ
while(str[len] != '\0')
{
++len;
}
return len;
}
26
例題:文字列の長さを調べる (#2)
文字列の末尾は常に null 文字があるので、そ
れが出現するまでの文字数をカウントする
int length(const char *str)
{
int len = 0; // 文字列の長さ
for(len = 0 ; str[len] != '\0'; ++len)
{
// do nothing
}
return len;
}
27
文字列を扱う標準ライブラリ関数
 <string.h>
には多くの
文字列操作
関数が含ま
れる
暗記の必要
はない
次回、いく
つかは練習
する
関数名
操作
strlen
文字列の長さを計算する
strcmp, strncmp
文字列が同じかどうか比較する
n 付きは、比較の長さを指定
strchr, strrchr
文字列の先頭(末尾)から特定の1文字を検索
する
strspn, strcspn
文字列から文字群を含む(含まない)最大の
長さを調べる
strpbrk
文字列から文字群のいずれかを含む最初の位
置を探す
strstr
文字列から指定した部分文字列の位置を探す
strtok
文字列を指定した区切り文字で区切って、そ
れぞれの位置を調べる(トークンという)
strcpy, strncpy
文字列を別の領域にコピーする
n 付きは、コピーの長さを指定
strcat, strncat
文字列を別の文字列の末尾に連結する
n 付きは、連結の長さを指定
28
例題:文字列の長さを調べる (#3)
先ほどの例題は、 strlen() を使うとよい
strlen() のプロトタイプ
#include <string.h>
size_t strlen(const char *s);
メモリ上のサイ
ズを十分表せる
無符号整数型
渡したアドレスの先
を書き換えないこと
が明示されている
29
次回予告
ファイルに文字列を出力する
文字列を数値に変換する
複雑な文字列を作成する
文字列をファイルから読み込む
30