UiPath StudioX 基本操作02 テーブル抽出を試す‼

UiPathを使おう

読者のみなさま!こんにちは!!Apachanです。
前回はUiPath StudioXを使ってExcelのコピペ操作を解説しました。
コピペは基本中の基本ですが、StudioXを使えばかんたんに設定できることが伝わったのではないでしょうか。
今回はStudioXの便利機能のひとつである「テーブル抽出」を探っていきたいと思います。

目次
1.為替レート情報の抽出
・下準備
・テーブル抽出の利用方法
・保存先の設定方法
・実行結果
2.課題
・次ページの情報
・表形式以外の構造化データ
まとめ

1.為替レート情報の抽出

下準備

「テーブル抽出」はWeb上の構造化データを用意に取得できる機能です。
今回は下記URLの表形式の構造化データであるリアルタイムの為替レートの取得を試してみます。

みんかぶFX
https://fx.minkabu.jp/pair
※ 取得対象範囲(赤枠)
為替レート(リアルタイム)のサンプル

新規でプロジェクトを作成した後に、まずは「Excelファイルを使用」のカードを配置してください。
今回は抽出したデータを保存をするため、Excelが必要となります。したがって参照すべきファイルは事前に設定しておきましょう。
そのあとに、画面上部リボン内の「テーブル抽出」ボタンを押下します。

テーブル抽出機能を実行

テーブル抽出の利用方法

StudioXのテーブル抽出を押下すると「抽出ウィザード」が起動します。
「次へ」を押下した後に、情報取得対象となるデータをクリックできるようにあらかじめGoogle Chromeにて対象のWebページを表示させておきましょう。

テーブル抽出の抽出ウィザード

表の左上の「通貨ペア」にマウスホバーしても(マウスカーソルを置いても)何も反応がない場合は、Uiフレームワークを変更しましょう。
私の場合、「Default」では反応がなかったため、「AA」に変更したところ改善しました。

UIフレームワーク選択方法の変更

反応がある場合は、マウスホバーすると対象のUIフレームが緑枠で囲われます。
この状態になったのを確認してクリックを実行してください。

UIフレームワークを選択

クリックを実行した後に対象の情報がうまく抽出できると「抽出ウィザード」が起動します。
正常に情報が取得できているようであれば、ダイアログ内の右下の終了を押下してくだださい。

抽出イメージ

今回のように複数ページにまたがる情報の場合は「はい」を押下してください。
「次のページへ」などに相当するページネーションがある場合は複数ページにまたがり情報がある可能性が高いでしょう。

複数ページのテーブル情報

「次のページへ」に相当するUIフレームを選択してください。
前述の通りマウスホバーで反応がなければ、UIフレームワークの選択方法を変更してください。

再びUIフレームワーク選択方法を変更

保存先の設定方法

テーブル抽出は完了しました。続いて保存先を設定します。
抽出先の保存先を設定するので「+」を押下します。
しかし、前段で設定したファイル名称が表示されません。

保存ファイルが表示されない事象

下図のように「テーブル抽出」を冒頭で設定したExcelカード内にドラッグ&ドロップしてください。

テーブル抽出をドラッグ&ドロップ

上記のようにテーブル抽出をExcelカード内に設定するとデータ保存用のファイルが選択可能になります。

保存ファイルが選択可能

抽出先に保存先ファイルが反映すれば準備は完了となります。
それでは実行してみましょう。

実行準備OK

実行結果

Excelファイル内に下図のようにWeb上のテーブル情報を取得することができました!
スクリーンショットと違いテキストデータの取得なので二次加工も問題なさそうです!!

実行結果

2.課題

次ページの情報

読者の皆さまはお気づきかも知れませんが、今回の抽出では1ページ目のみしか情報が取得できていませんでした。
本来であれば2, 3, 4ページの情報も取得できるのが正常な挙動となります。
新機能なためかStudioXの情報がまだ少ないので、このあたりの原因と対処法は引き続き検証していきたいと思います。

表形式以外の構造化データ

今回表形式のデータで試しましたが、構造化データにはリスト形式も存在します。
いくつか試してみましたが、下図のようにリスト形式(表形式以外)はうまくUIフレームを認識しませんでした。
旧名称の「データ抽出」と表記された前Ver.のStudioXではリスト形式のデータも取得できていたようです。
このあたりも引き続き検証していきたいと思います。

この2点が解消されれば実務で活用する幅が劇的に広がる予感があります。
※ 参考ソース
https://docs.uipath.com/studiox/docs/tutorial-extracting-table-data-from-a-web-page-and-editing-it-in-excel

リスト形式の構造化データ

まとめ

今回はStudioXのテーブル抽出機能の主とする動きを試してみました。
かんたんに操作できた一方で、正常に動作しないところもあったため引き続き検証していきたいと思います。

Apachan

約10年間の代理店営業を経験した後にITに興味を持ちプログラミングを習得。営業で培ったコミュニケーション力を活かしつつ...業務現場からボトルネックとなる問題点を発見して、ITを活用した改善に日々取り組み中。
RPAに限らず、SaaSやGAS, VBA活用など環境にあった改善を心がけています。個人的にGASが好きです。
お気軽にご相談ください。

関連記事